Temario del curso
Fundamentos de los sistemas basados en agentes en producción
- Arquitecturas de agentes: bucles, herramientas, memoria y capas de orquestación
- Ciclo de vida de los agentes: desarrollo, despliegue y operación continua
- Desafíos de la gestión de agentes a escala de producción
Modelos de infraestructura y despliegue
- Despliegue de agentes en entornos en contenedores y en la nube
- Patrones de escalado: escalado horizontal frente a vertical, concurrencia y limitación
- Orquestación de múltiples agentes y balanceo de cargas de trabajo
Monitoreo y observabilidad
- Métricas clave: latencia, tasa de éxito, uso de memoria y profundidad de llamadas de agentes
- Rastreo de la actividad de los agentes y gráficos de llamadas
- Instrumentación de la observabilidad utilizando Prometheus, OpenTelemetry y Grafana
Registro, auditoría y cumplimiento
- Registro centralizado y recolección estructurada de eventos
- Cumplimiento y trazabilidad en flujos de trabajo basados en agentes
- Diseño de rastros de auditoría y mecanismos de reproducción para depuración
Ajuste de rendimiento y optimización de recursos
- Reducción de la sobrecarga de inferencia y optimización de los ciclos de orquestación de agentes
- Almacenamiento en caché de modelos e incrustaciones ligeras para recuperaciones más rápidas
- Pruebas de carga y escenarios de estrés para pipelines de IA
Control de costos y gobernanza
- Comprensión de los factores que impulsan los costos de los agentes: llamadas a API, memoria, cómputo e integraciones externas
- Seguimiento de costos a nivel de agente e implementación de modelos de imputación de costos
- Políticas de automatización para prevenir la proliferación de agentes y el consumo de recursos inactivos
Estrategias de CI/CD y despliegue para agentes
- Integración de pipelines de agentes en sistemas de CI/CD
- Pruebas, gestión de versiones y estrategias de reversión para actualizaciones iterativas de agentes
- Despliegues progresivos y mecanismos de implementación segura
Recuperación ante fallos e ingeniería de confiabilidad
- Diseño para tolerancia a fallos y degradación elegante
- Patrones de reintento, tiempo de espera y cortacircuitos para la confiabilidad de los agentes
- Marcos de respuesta a incidentes y análisis post-mortem para operaciones de IA
Proyecto final
- Construir y desplegar un sistema de IA basado en agentes con monitoreo completo y seguimiento de costos
- Simular carga, medir el rendimiento y optimizar el uso de recursos
- Presentar la arquitectura final y el panel de monitoreo a los compañeros
Resumen y siguientes pasos
Requerimientos
- Dominio sólido de MLOps y sistemas de aprendizaje automático en producción
- Experiencia en despliegues en contenedores (Docker/Kubernetes)
- Familiaridad con herramientas de optimización de costos en la nube y de observabilidad
Audiencia
- Ingenieros de MLOps
- Ingenieros de Confiabilidad del Sitio (SRE)
- Gerentes de ingeniería responsables de la infraestructura de IA
Testimonios (3)
El instructor es paciente y muy útil. Conoce bien el tema.
CLIFFORD TABARES - Universal Leaf Philippines, Inc.
Curso - Agentic AI for Business Automation: Use Cases & Integration
Traducción Automática
Buena mezcla de conocimiento y práctica
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Agentic AI for Enterprise Applications
Traducción Automática
La mezcla de teoría y práctica, así como de perspectivas de alto y bajo nivel
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Autonomous Decision-Making with Agentic AI
Traducción Automática