Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Diseño de una arquitectura abierta de AIOps
- Descripción general de los componentes clave en las pipelines abiertas de AIOps
- Flujo de datos desde la ingesta hasta la generación de alertas
- Comparación de herramientas y estrategia de integración
Recolección y agregación de datos
- Ingesta de datos de series temporales con Prometheus
- Captura de registros con Logstash y Beats
- Normalización de datos para correlación entre múltiples fuentes
Construcción de paneles de observabilidad
- Visualización de métricas con Grafana
- Creación de paneles en Kibana para análisis de registros
- Uso de consultas en Elasticsearch para extraer información operativa
Detección de anomalías y predicción de incidentes
- Exportación de datos de observabilidad hacia pipelines en Python
- Entrenamiento de modelos de aprendizaje automático para detección de valores atípicos y pronóstico
- Despliegue de modelos para inferencia en tiempo real dentro de la pipeline de observabilidad
Generación de alertas y automatización con herramientas de código abierto
- Creación de reglas de alerta en Prometheus y enrutamiento con Alertmanager
- Activación de scripts o flujos de trabajo mediante API para respuesta automática
- Uso de herramientas de orquestación de código abierto (por ejemplo, Ansible, Rundeck)
Consideraciones sobre integración y escalabilidad
- Manejo de ingesta de alto volumen y retención a largo plazo
- Seguridad y control de acceso en pilas de código abierto
- Escalamiento independiente de cada capa: ingesta, procesamiento y generación de alertas
Aplicaciones y extensiones en el mundo real
- Estudios de caso: ajuste de rendimiento, prevención de tiempos de inactividad y optimización de costos
- Extensión de pipelines con herramientas de trazabilidad o grafos de servicios
- Mejores prácticas para ejecutar y mantener AIOps en producción
Resumen y siguientes pasos
Requerimientos
- Experiencia con herramientas de observabilidad como Prometheus o ELK
- Conocimientos funcionales de Python y fundamentos de aprendizaje automático
- Comprensión de operaciones de TI y flujos de trabajo de generación de alertas
Público objetivo
- Ingenieros de confiabilidad de sitios (SRE) de nivel avanzado
- Ingenieros de datos que trabajan en operaciones
- Líderes de plataformas de DevOps y arquitectos de infraestructura
14 Horas