Contacta con nosotros

Temario del curso

Introducción a los LLM multimodales en Vertex AI

  • Descripción general de las capacidades multimodales en Vertex AI
  • Modelos de Gemini y modalidades soportadas
  • Casos de uso en empresas e investigación

Configuración del entorno de desarrollo

  • Configuración de Vertex AI para flujos de trabajo multimodales
  • Trabajo con conjuntos de datos en múltiples modalidades
  • Laboratorio práctico: configuración del entorno y preparación de datos

Ventanas de contexto extendidas y razonamiento avanzado

  • Comprensión de flujos de trabajo con contexto extendido
  • Casos de uso en planificación y toma de decisiones
  • Laboratorio práctico: implementación de análisis con contexto extendido

Diseño de flujos de trabajo cruzados entre modalidades

  • Combinación de análisis de texto, audio e imagen
  • Encadenamiento de pasos multimodales en pipelines
  • Laboratorio práctico: diseño de un pipeline multimodal

Trabajo con parámetros de la API de Gemini

  • Configuración de entradas y salidas multimodales
  • Optimización de la inferencia y la eficiencia
  • Laboratorio práctico: ajuste de parámetros de la API de Gemini

Aplicaciones e integraciones avanzadas

  • Agentes y asistentes interactivos multimodales
  • Integración de APIs y herramientas externas
  • Laboratorio práctico: construcción de una aplicación multimodal

Evaluación e iteración

  • Pruebas del rendimiento multimodal
  • Métricas para precisión, alineación y desviación
  • Laboratorio práctico: evaluación de flujos de trabajo multimodales

Resumen y próximos pasos

Requerimientos

  • Dominio de la programación en Python
  • Experiencia en el desarrollo de modelos de aprendizaje automático
  • Familiaridad con datos multimodales (texto, audio, imagen)

Público objetivo

  • Investigadores en IA
  • Desarrolladores avanzados
  • Científicos de ML
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas