Contacta con nosotros

Temario del curso

Fundamentos de la clasificación de audio

  • Tipos de eventos sonoros: ambientales, mecánicos, generados por humanos
  • Vista general de los casos de uso: vigilancia, monitoreo, automatización
  • Clasificación de audio frente a detección y segmentación

Datos de audio y extracción de características

  • Tipos de archivos de audio y formatos
  • Tasa de muestreo, ventanas y consideraciones sobre el tamaño del marco
  • Extracción de MFCC, características cromáticas y mel-espectrogramas

Preparación de datos y anotación

  • UrbanSound8K, ESC-50 y conjuntos de datos personalizados
  • Anotación de eventos sonoros y límites temporales
  • Balanceo de conjuntos de datos y aumento de audio (data augmentation)

Construcción de modelos de clasificación de audio

  • Uso de redes neuronales convolucionales (CNN) para audio
  • Entrada del modelo: forma de onda cruda frente a características
  • Funciones de pérdida, métricas de evaluación y sobreajuste

Detección de eventos y localización temporal

  • Estrategias de detección basadas en marcos y segmentos
  • Postprocesamiento de detecciones mediante umbrales y suavizado
  • Visualización de las predicciones en líneas de tiempo de audio

Temas avanzados y procesamiento en tiempo real

  • Aprendizaje por transferencia para escenarios con pocos datos
  • Despliegue de modelos con TensorFlow Lite u ONNX
  • Procesamiento de audio en streaming y consideraciones sobre latencia

Desarrollo del proyecto y escenarios de aplicación

  • Diseño de una canalización completa: desde la ingesta hasta la clasificación
  • Desarrollo de un prototipo para vigilancia, control de calidad o monitoreo
  • Registro (logging), alertas e integración con paneles de control o APIs

Resumen y próximos pasos

Requerimientos

  • Comprensión de los conceptos de aprendizaje automático y entrenamiento de modelos
  • Experiencia con programación en Python y preprocesamiento de datos
  • Familiaridad con los fundamentos del audio digital

Público objetivo

  • Científicos de datos
  • Ingenieros de aprendizaje automático
  • Investigadores y desarrolladores en procesamiento de señales de audio
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas