Contacta con nosotros

Temario del curso

Introducción a los modelos multimodales

  • Visión general del aprendizaje automático multimodal
  • Aplicaciones de los modelos multimodales
  • Desafíos en el manejo de múltiples tipos de datos

Arquitecturas para modelos multimodales

  • Exploración de modelos como CLIP, Flamingo y BLIP
  • Comprensión de los mecanismos de atención cross-modal
  • Consideraciones arquitectónicas para escalabilidad y eficiencia

Preparación de conjuntos de datos multimodales

  • Técnicas de recolección y anotación de datos
  • Preprocesamiento de entradas de texto, imágenes y video
  • Equilibrado de conjuntos de datos para tareas multimodales

Técnicas de ajuste fino para modelos multimodales

  • Configuración de pipelines de entrenamiento para modelos multimodales
  • Gestión de restricciones de memoria y cómputo
  • Manejo de la alineación entre modalidades

Aplicaciones de modelos multimodales ajustados finamente

  • Respuesta a preguntas visuales
  • Descripción de imágenes y videos
  • Generación de contenido utilizando entradas multimodales

Optimización y evaluación del rendimiento

  • Métricas de evaluación para tareas multimodales
  • Optimización de latencia y rendimiento para producción
  • Garantía de robustez y coherencia entre modalidades

Implementación de modelos multimodales

  • Empaquetado de modelos para implementación
  • Escalabilidad de inferencia en plataformas en la nube
  • Aplicaciones e integraciones en tiempo real

Estudios de caso y laboratorios prácticos

  • Ajuste fino de CLIP para recuperación de imágenes basada en contenido
  • Entrenamiento de un chatbot multimodal con texto y video
  • Implementación de sistemas de recuperación cross-modal

Resumen y siguientes pasos

Requerimientos

  • Competencia en programación en Python
  • Comprensión de conceptos de aprendizaje profundo
  • Experiencia en el ajuste fino de modelos preentrenados

Público objetivo

  • Investigadores en IA
  • Científicos de datos
  • Practicantes de aprendizaje automático
 28 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas