Contacta con nosotros

Temario del curso

Introducción a la IA Multimodal

  • Panorama general de la IA multimodal y sus aplicaciones en el mundo real.
  • Desafíos en la integración de datos de texto, imágenes y audio.
  • Investigaciones y avances de vanguardia.

Procesamiento de datos e ingeniería de características

  • Manejo de conjuntos de datos de texto, imágenes y audio.
  • Técnicas de preprocesamiento para el aprendizaje multimodal.
  • Extracción de características y estrategias de fusión de datos.

Construcción de modelos multimodales con PyTorch y Hugging Face

  • Introducción a PyTorch para el aprendizaje multimodal.
  • Uso de Transformers de Hugging Face para tareas de procesamiento de lenguaje natural y visión por computadora.
  • Combinación de diferentes modalidades en un modelo de IA unificado.

Implementación de la fusión de voz, visión y texto

  • Integración de OpenAI Whisper para reconocimiento de voz.
  • Aplicación de DeepSeek-Vision para el procesamiento de imágenes.
  • Técnicas de fusión para el aprendizaje multimodal.

Entrenamiento y optimización de modelos de IA multimodal

  • Estrategias de entrenamiento para IA multimodal.
  • Técnicas de optimización y ajuste de hiperparámetros.
  • Manejo de sesgos y mejora de la generalización del modelo.

Despliegue de IA multimodal en aplicaciones del mundo real

  • Exportación de modelos para su uso en producción.
  • Despliegue de modelos de IA en plataformas en la nube.
  • Monitoreo del rendimiento y mantenimiento de los modelos.

Temas avanzados y tendencias futuras

  • Aprendizaje sin ejemplos y con pocos ejemplos en IA multimodal.
  • Consideraciones éticas y desarrollo responsable de la IA.
  • Tendencias emergentes en la investigación de IA multimodal.

Resumen y próximos pasos

Requerimientos

  • Sólido dominio de los conceptos de aprendizaje automático y aprendizaje profundo.
  • Experiencia en el uso de herramientas de IA como PyTorch o TensorFlow.
  • Conocimiento en el procesamiento de datos de texto, imágenes y audio.

Público objetivo

  • Desarrolladores de IA
  • Ingenieros de aprendizaje automático
  • Investigadores
 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas