Programa del Curso

Introducción a AIOps con Herramientas de Código Abierto

  • Resumen de conceptos y beneficios de AIOps
  • Prometheus y Grafana en la pila de observabilidad
  • Dónde se integra el ML en AIOps: análisis predictivo vs. reactivo

Configuración de Prometheus y Grafana

  • Instalación y configuración de Prometheus para la recolección de series temporales
  • Creación de paneles en Grafana utilizando métricas en tiempo real
  • Explorando exportadores, reetiquetado y descubrimiento de servicios

Preprocesamiento de Datos para ML

  • Extracción y transformación de métricas Prometheus
  • Preparación de conjuntos de datos para la detección de anomalías y pronóstico
  • Uso de transformaciones en Grafana o pipelines de Python

Aplicando Machine Learning para Detección de Anomalías

  • Modelos ML básicos para detección de outliers (por ejemplo, Bosque de Aislamiento, SVM Uniclass)
  • Entrenamiento y evaluación de modelos en datos de series temporales
  • Visualización de anomalías en paneles de Grafana

Métricas de ML con Forecasting

  • Construcción de modelos sencillos de pronóstico (ARIMA, Prophet, introducción a LSTM)
  • Predicción del carga del sistema o uso de recursos
  • Uso de predicciones para alertas tempranas y decisiones de escalado

Integración de ML con Alertas y Automatización

  • Definición de reglas de alerta basadas en la salida de ML o umbrales
  • Uso de Alertmanager y enrutamiento de notificaciones
  • Disparo de scripts u orquestación de flujos de trabajo automatizados al detectar anomalías

Escalado y Operacionalización de AIOps

  • Integración con herramientas externas de observabilidad (por ejemplo, pila ELK, Moogsoft, Dynatrace)
  • Operaciones de modelos ML en pipelines de observabilidad
  • Mejores prácticas para AIOps a escala

Resumen y Pasos Siguientes

Requerimientos

  • Comprender los conceptos de monitoreo del sistema y observabilidad
  • Experiencia usando Grafana o Prometheus
  • Familiaridad con Python y principios básicos de aprendizaje automático

Áudience

  • Ingenieros de observabilidad
  • Equipos de infraestructura y DevOps
  • Arquitectos de plataformas de monitoreo e ingenieros de confiabilidad del sitio (SREs)
 14 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas