Contacta con nosotros

Temario del curso

Introducción a la multimodalidad de Gemini 3

  • Capacidades en texto, imágenes, audio y video
  • Selección de modelos y descripción general de endpoints
  • Conceptos clave en razonamiento multimodal

Trabajo con texto y entradas estructuradas

  • Estrategias de prompting para generación de texto
  • Metadatos, ventanas de contexto y embeddings
  • Orquestación basada en texto de tareas multimodales

Comprensión de imágenes y flujos de trabajo visuales

  • Análisis e interpretación de imágenes con Gemini 3
  • Creación de herramientas de búsqueda y etiquetado visual
  • Desarrollo de interacciones de imagen a texto y de texto a imagen

Procesamiento de entradas de audio

  • Flujos de trabajo de reconocimiento y transcripción de voz
  • Detección e interpretación de eventos de audio
  • Integración de audio con entradas de texto y visuales

Inteligencia de video y análisis de escenas

  • Razonamiento de video cuadro a cuadro y continuo
  • Creación de herramientas de resumen y extracción de destacados
  • Automatización basada en video y flujos de trabajo de contenido

Diseño de arquitecturas de aplicaciones multimodales

  • Combinación de múltiples tipos de entrada en un solo pipeline
  • Consideraciones de latencia, costo y cómputo
  • Mejores prácticas para sistemas multimodales escalables

Prototipado de aplicaciones multimodales

  • Creación práctica de prototipos multimodales
  • Iteración rápida con ingeniería de prompts
  • Prueba y refinamiento de flujos de experiencia de usuario

Despliegue de soluciones multimodales

  • Estrategias de despliegue y configuración del entorno
  • Monitoreo del rendimiento en entornos reales
  • Consideraciones de seguridad y cumplimiento normativo

Resumen y próximos pasos

Requerimientos

  • Comprensión de conceptos modernos de inteligencia artificial
  • Experiencia con Python o JavaScript
  • Familiaridad con APIs REST

Público objetivo

  • Diseñadores
  • Creadores de contenido
  • Equipos técnicos de productos
 14 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas