Contacta con nosotros

Temario del curso

Preparación de modelos de aprendizaje automático para implementación

  • Empaquetado de modelos con Docker.
  • Exportación de modelos desde TensorFlow y PyTorch.
  • Consideraciones sobre versionado y almacenamiento.

Servicio de modelos en Kubernetes

  • Visión general de los servidores de inferencia.
  • Implementación de TensorFlow Serving y TorchServe.
  • Configuración de puntos de conexión (endpoints) de modelos.

Técnicas de optimización de la inferencia

  • Estrategias de agrupamiento (batching).
  • Gestión de solicitudes simultáneas.
  • Ajuste de latencia y rendimiento.

Escalar automáticamente las cargas de trabajo de ML

  • Horizontal Pod Autoscaler (HPA).
  • Vertical Pod Autoscaler (VPA).
  • Kubernetes Event-Driven Autoscaling (KEDA).

Provisionamiento de GPU y gestión de recursos

  • Configuración de nodos con GPU.
  • Visión general del plugin de dispositivos NVIDIA.
  • Solicitudes y límites de recursos para cargas de trabajo de ML.

Estrategias de lanzamiento y liberación de modelos

  • Despliegues azul/verde.
  • Patrones de lanzamiento canario.
  • Pruebas A/B para la evaluación de modelos.

Monitoreo y observabilidad de ML en producción

  • Métricas para cargas de trabajo de inferencia.
  • Prácticas de registro y seguimiento (logging y tracing).
  • Tableros (dashboards) y alertas.

Consideraciones de seguridad y fiabilidad

  • Seguridad de los puntos de conexión de modelos.
  • Políticas de red y control de acceso.
  • Aseguramiento de la alta disponibilidad.

Resumen y próximos pasos

Requerimientos

  • Comprensión de los flujos de trabajo de aplicaciones contenerizadas.
  • Experiencia con modelos de aprendizaje automático basados en Python.
  • Conocimiento de los fundamentos de Kubernetes.

Público objetivo

  • Ingenieros de ML.
  • Ingenieros de DevOps.
  • Equipos de ingeniería de plataformas.
 14 Horas

Número de participantes


Precio por participante

Testimonios (4)

Próximos cursos

Categorías Relacionadas