Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Fundamentos de la clasificación de audio
- Tipos de eventos sonoros: ambientales, mecánicos, generados por humanos.
- Descripción general de casos de uso: vigilancia, monitoreo, automatización.
- Clasificación de audio frente a detección frente a segmentación.
Datos de audio y extracción de características
- Tipos de archivos y formatos de audio.
- Consideraciones sobre tasa de muestreo, ventaneo y tamaño de marco.
- Extracción de MFCC, características cromáticas y espectrogramas mel.
Preparación y anotación de datos
- UrbanSound8K, ESC-50 y conjuntos de datos personalizados.
- Etiquetado de eventos sonoros y límites temporales.
- Balanceo de conjuntos de datos y aumento de audio.
Creación de modelos de clasificación de audio
- Uso de redes neuronales convolucionales (CNN) para audio.
- Entrada del modelo: forma de onda cruda frente a características.
- Funciones de pérdida, métricas de evaluación y sobreajuste.
Detección de eventos y localización temporal
- Estrategias de detección basadas en marcos y segmentos.
- Postprocesamiento de detecciones usando umbrales y suavizado.
- Visualización de predicciones en líneas de tiempo de audio.
Temas avanzados y procesamiento en tiempo real
- Aprendizaje por transferencia para escenarios con pocos datos.
- Implementación de modelos con TensorFlow Lite u ONNX.
- Procesamiento de audio en streaming y consideraciones de latencia.
Desarrollo de proyectos y escenarios de aplicación
- Diseño de un pipeline completo: desde la ingestión hasta la clasificación.
- Desarrollo de un prototipo para vigilancia, control de calidad o monitoreo.
- Registro, alertas e integración con paneles de control o APIs.
Resumen y próximos pasos
Requerimientos
- Comprensión de los conceptos de aprendizaje automático y entrenamiento de modelos.
- Experiencia en programación con Python y preprocesamiento de datos.
- Familiaridad con los fundamentos del audio digital.
Público objetivo
- Científicos de datos.
- Ingenieros de aprendizaje automático.
- Investigadores y desarrolladores en procesamiento de señales de audio.
21 Horas