Cambiar una voz con una red neuronalSíntesis de voz y voz con IA: el libro completo

Cambiar una voz con una red neuronal

Cambiar una voz significa alterar su timbre, género, edad o "carácter" manteniendo intactas las palabras y la entonación. Sobre esto se construyen el anonimato, los personajes para locuciones, el contenido de entretenimiento y los directos. A diferencia de la clonación, aquí no necesitas la muestra de una persona concreta — simplemente conviertes una voz en otra.

Cómo funciona

La red separa una grabación en dos partes: qué se dijo (las palabras y la entonación) y quién lo dijo (el timbre, el carácter de la voz). Conserva lo primero y sustituye lo segundo por la voz que elijas. Así tu discurso, tu emoción y tu ritmo se mantienen, pero se oye a otra persona. Esto se llama conversión de voz (voice conversion).

Sube una grabación (o graba una) — elige una voz nueva y escucha el resultado. Las primeras generaciones son gratis tras registrarte.

Загрузка…

Qué se puede cambiar

  • Género — masculina ↔ femenina.
  • Edad y carácter — más joven/mayor, más suave/dura.
  • Personaje — voz de robot, de héroe de cuento, de narrador.
  • Anonimización — ocultar tu voz manteniendo el discurso (por ejemplo, para una entrevista).

Para que salga limpio

  • Una grabación limpia, sin ruido. El fondo y el eco pasan al resultado — graba en un lugar silencioso.
  • Habla natural en el original. La conversión conserva la entonación: habla con expresividad y el resultado será vivo.
  • Una voz objetivo cercana en registro. Convertir una voz muy grave en una muy aguda suena menos natural que un cambio moderado.

Cambiar una voz frente a clonar

Una confusión habitual. Cambiar una voz convierte el habla en otra voz (un preajuste listo o una abstracta). Clonar una voz reproduce la voz concreta de una persona real a partir de una muestra. Lo primero va de estilo y anonimato; lo segundo, de una copia exacta (y mucho más sensible éticamente).

Importante: la ética

Cambiar tu propia voz o usar preajustes abstractos es inofensivo. Pero convertir tu habla en la voz de una persona real concreta sin su consentimiento ya es terreno de la clonación y sus riesgos (más en el siguiente capítulo). No uses el cambio de voz para engañar haciéndote pasar por otra persona.

Qué sigue

Si no necesitas "otra voz cualquiera" sino una copia exacta de una voz concreta, eso es clonación — la función más potente y más sensible de esta guía.


En el chat de Twelver puedes subir una grabación y cambiar la voz directamente en la conversación. Algunas generaciones son gratis tras registrarte.

Pruébalo tú mismo

Todo lo de esta guía funciona en Twelver

Un chat para texto, imágenes, vídeo, música y voz — sin servicios ni suscripciones aparte.

Abrir el chat de Twelver
Оцените свой опыт