Contacta con nosotros

Temario del curso

Diseño de una arquitectura abierta de AIOps

  • Descripción general de los componentes clave en las pipelines abiertas de AIOps
  • Flujo de datos desde la ingesta hasta la generación de alertas
  • Comparación de herramientas y estrategia de integración

Recolección y agregación de datos

  • Ingesta de datos de series temporales con Prometheus
  • Captura de registros con Logstash y Beats
  • Normalización de datos para correlación entre múltiples fuentes

Construcción de paneles de observabilidad

  • Visualización de métricas con Grafana
  • Creación de paneles en Kibana para análisis de registros
  • Uso de consultas en Elasticsearch para extraer información operativa

Detección de anomalías y predicción de incidentes

  • Exportación de datos de observabilidad hacia pipelines en Python
  • Entrenamiento de modelos de aprendizaje automático para detección de valores atípicos y pronóstico
  • Despliegue de modelos para inferencia en tiempo real dentro de la pipeline de observabilidad

Generación de alertas y automatización con herramientas de código abierto

  • Creación de reglas de alerta en Prometheus y enrutamiento con Alertmanager
  • Activación de scripts o flujos de trabajo mediante API para respuesta automática
  • Uso de herramientas de orquestación de código abierto (por ejemplo, Ansible, Rundeck)

Consideraciones sobre integración y escalabilidad

  • Manejo de ingesta de alto volumen y retención a largo plazo
  • Seguridad y control de acceso en pilas de código abierto
  • Escalamiento independiente de cada capa: ingesta, procesamiento y generación de alertas

Aplicaciones y extensiones en el mundo real

  • Estudios de caso: ajuste de rendimiento, prevención de tiempos de inactividad y optimización de costos
  • Extensión de pipelines con herramientas de trazabilidad o grafos de servicios
  • Mejores prácticas para ejecutar y mantener AIOps en producción

Resumen y siguientes pasos

Requerimientos

  • Experiencia con herramientas de observabilidad como Prometheus o ELK
  • Conocimientos funcionales de Python y fundamentos de aprendizaje automático
  • Comprensión de operaciones de TI y flujos de trabajo de generación de alertas

Público objetivo

  • Ingenieros de confiabilidad de sitios (SRE) de nivel avanzado
  • Ingenieros de datos que trabajan en operaciones
  • Líderes de plataformas de DevOps y arquitectos de infraestructura
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas