Contacta con nosotros

Temario del curso

Introducción a la síntesis de voz y la clonación de voz

  • Descripción general de TTS (síntesis de voz de texto a habla) y síntesis neuronal
  • Clonación de voz frente a generación de habla: casos de uso y límites
  • Modelos clave: Tacotron, WaveNet, FastSpeech, VITS

Trabajo con plataformas comerciales

  • Uso de ElevenLabs y Resemble AI
  • Creación, clonación y edición de voces
  • Acceso a la API y flujos de trabajo de texto a habla

Desarrollo con herramientas de código abierto

  • Instalación y configuración de Coqui TTS
  • Entrenamiento de voces personalizadas y gestión de conjuntos de datos
  • Generación de habla con control fino (tono, velocidad, emoción)

Preparación de datos y gestión de conjuntos de datos de voz

  • Recopilación y limpieza de muestras de voz
  • Segmentación, etiquetado y alineación de transcripciones
  • Obtención ética de datos y consentimiento para el uso de voz

Integración de aplicaciones

  • Incorporar TTS en sitios web y aplicaciones
  • Crear sistemas IVR y bots interactivos
  • Generar diálogos sintéticos para video y juegos

Evaluación de la calidad y el realismo

  • Puntuación media de opinión (MOS) y pruebas de inteligibilidad
  • Control de la expresividad y la prosodia
  • Comparación de latencia, fidelidad y realismo

Consideraciones éticas, legales y de gobernanza

  • Riesgos de deepfakes y uso responsable
  • Implicaciones relacionadas con el consentimiento, la atribución y los derechos de autor
  • Regulaciones y políticas organizativas

Resumen y próximos pasos

Requerimientos

  • Comprensión de los fundamentos del aprendizaje automático
  • Familiaridad con formatos de archivos de audio y herramientas de edición
  • Habilidades básicas de programación en Python

Público objetivo

  • Desarrolladores e ingenieros de IA interesados en la síntesis de voz
  • Creadores de contenido y tecnólogos de medios que exploran la generación de voz
  • Equipos de I+D que construyen sistemas de audio personalizados o dinámicos
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas