Contacta con nosotros

Temario del curso

Fundamentos de los sistemas basados en agentes en producción

  • Arquitecturas de agentes: bucles, herramientas, memoria y capas de orquestación
  • Ciclo de vida de los agentes: desarrollo, despliegue y operación continua
  • Desafíos de la gestión de agentes a escala de producción

Modelos de infraestructura y despliegue

  • Despliegue de agentes en entornos en contenedores y en la nube
  • Patrones de escalado: escalado horizontal frente a vertical, concurrencia y limitación
  • Orquestación de múltiples agentes y balanceo de cargas de trabajo

Monitoreo y observabilidad

  • Métricas clave: latencia, tasa de éxito, uso de memoria y profundidad de llamadas de agentes
  • Rastreo de la actividad de los agentes y gráficos de llamadas
  • Instrumentación de la observabilidad utilizando Prometheus, OpenTelemetry y Grafana

Registro, auditoría y cumplimiento

  • Registro centralizado y recolección estructurada de eventos
  • Cumplimiento y trazabilidad en flujos de trabajo basados en agentes
  • Diseño de rastros de auditoría y mecanismos de reproducción para depuración

Ajuste de rendimiento y optimización de recursos

  • Reducción de la sobrecarga de inferencia y optimización de los ciclos de orquestación de agentes
  • Almacenamiento en caché de modelos e incrustaciones ligeras para recuperaciones más rápidas
  • Pruebas de carga y escenarios de estrés para pipelines de IA

Control de costos y gobernanza

  • Comprensión de los factores que impulsan los costos de los agentes: llamadas a API, memoria, cómputo e integraciones externas
  • Seguimiento de costos a nivel de agente e implementación de modelos de imputación de costos
  • Políticas de automatización para prevenir la proliferación de agentes y el consumo de recursos inactivos

Estrategias de CI/CD y despliegue para agentes

  • Integración de pipelines de agentes en sistemas de CI/CD
  • Pruebas, gestión de versiones y estrategias de reversión para actualizaciones iterativas de agentes
  • Despliegues progresivos y mecanismos de implementación segura

Recuperación ante fallos e ingeniería de confiabilidad

  • Diseño para tolerancia a fallos y degradación elegante
  • Patrones de reintento, tiempo de espera y cortacircuitos para la confiabilidad de los agentes
  • Marcos de respuesta a incidentes y análisis post-mortem para operaciones de IA

Proyecto final

  • Construir y desplegar un sistema de IA basado en agentes con monitoreo completo y seguimiento de costos
  • Simular carga, medir el rendimiento y optimizar el uso de recursos
  • Presentar la arquitectura final y el panel de monitoreo a los compañeros

Resumen y siguientes pasos

Requerimientos

  • Dominio sólido de MLOps y sistemas de aprendizaje automático en producción
  • Experiencia en despliegues en contenedores (Docker/Kubernetes)
  • Familiaridad con herramientas de optimización de costos en la nube y de observabilidad

Audiencia

  • Ingenieros de MLOps
  • Ingenieros de Confiabilidad del Sitio (SRE)
  • Gerentes de ingeniería responsables de la infraestructura de IA
 21 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas