Contacta con nosotros

Temario del curso

Introducción a las operaciones de Kubernetes mejoradas con IA

  • Por qué la IA es crucial para las operaciones modernas de clúster
  • Limitaciones de la lógica tradicional de escalado y programación
  • Conceptos clave del aprendizaje automático para la gestión de recursos

Fundamentos de la gestión de recursos en Kubernetes

  • Fundamentos de la asignación de CPU, GPU y memoria
  • Comprensión de cuotas, límites y solicitudes
  • Identificación de cuellos de botella e ineficiencias

Enfoques de aprendizaje automático para la programación

  • Modelos supervisados y no supervisados para la ubicación de cargas de trabajo
  • Algoritmos predictivos para la demanda de recursos
  • Uso de características de aprendizaje automático en programadores personalizados

Aprendizaje por refuerzo para el autoescalado inteligente

  • Cómo los agentes de aprendizaje por refuerzo aprenden del comportamiento del clúster
  • Diseño de funciones de recompensa para mejorar la eficiencia
  • Desarrollo de estrategias de autoescalado impulsadas por aprendizaje por refuerzo

Autoescalado predictivo con métricas y telemetría

  • Uso de datos de Prometheus para realizar pronósticos
  • Aplicación de modelos de series temporales al autoescalado
  • Evaluación de la precisión de las predicciones y ajuste de modelos

Implementación de herramientas de optimización impulsadas por IA

  • Integración de marcos de aprendizaje automático con controladores de Kubernetes
  • Implementación de bucles de control inteligentes
  • Extensión de KEDA para la toma de decisiones asistida por IA

Estrategias de optimización de costos y rendimiento

  • Reducción de costos de computación mediante escalado predictivo
  • Mejora de la utilización de GPU con ubicación impulsada por aprendizaje automático
  • Equilibrio entre latencia, rendimiento y eficiencia

Escenarios prácticos y casos de uso del mundo real

  • Autoescalado de aplicaciones de alta carga con IA
  • Optimización de grupos de nodos heterogéneos
  • Aplicación de aprendizaje automático en entornos multiinquilino

Resumen y próximos pasos

Requerimientos

  • Comprensión de los fundamentos de Kubernetes
  • Experiencia en la implementación de aplicaciones contenidas
  • Familiaridad con operaciones de clúster y gestión de recursos

Público objetivo

  • Ingenieros de confiabilidad de sitios (SRE) que trabajan con sistemas distribuidos a gran escala
  • Operadores de Kubernetes que gestionan cargas de trabajo de alta demanda
  • Ingenieros de plataforma que optimizan la infraestructura de computación
 21 Horas

Número de participantes


Precio por participante

Testimonios (4)

Próximos cursos

Categorías Relacionadas