Contacta con nosotros

Temario del curso

Repaso de los fundamentos de Apache Airflow

  • Conceptos principales: DAGs, tareas y operadores
  • Arquitectura y componentes de Airflow
  • Repaso de casos de uso y flujos de trabajo comunes

Optimización del rendimiento de los flujos de trabajo

  • Identificación de cuellos de botella en los pipelines de Airflow
  • Técnicas de optimización a nivel de tarea
  • Aprovechamiento de reintentos de tareas, paralelismo y concurrencia

Gestión de dependencias complejas

  • Definición de dependencias dinámicas en los flujos de trabajo
  • Manejo de flujos de trabajo condicionales y con ramificaciones
  • Uso efectivo de grupos de tareas y sub-DAGs

Características avanzadas en Apache Airflow

  • Creación de operadores y hooks personalizados
  • Implementación de sensores para activadores externos
  • Integración de servicios y complementos de terceros

Escalado de implementaciones de Apache Airflow

  • Enfoques de escalado horizontal y vertical
  • Uso de Ejecutores Celery para ejecución distribuida
  • Mejores prácticas para el escalado en entornos en la nube

Supervisión y depuración de flujos de trabajo

  • Configuración de registros y alertas para la supervisión de flujos de trabajo
  • Uso de la interfaz gráfica y la CLI de Airflow para la resolución de problemas
  • Identificación y solución de problemas comunes en implementaciones de Airflow

Seguridad de Apache Airflow

  • Autenticación y control de acceso en Airflow
  • Protección de datos sensibles y configuraciones del entorno
  • Implementación de registros de auditoría para los flujos de trabajo

Casos de uso empresariales y mejores prácticas

  • Diseño de flujos de trabajo robustos para entornos de producción
  • Aprovechamiento de Airflow para ingeniería de datos y pipelines de ETL
  • Exploración de estudios de caso reales de implementaciones escalables de Airflow

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de Apache Airflow
  • Familiaridad con la programación en Python y los conceptos de orquestación de flujos de trabajo
  • Experiencia en la gestión y el despliegue de aplicaciones en entornos Linux

Público objetivo

  • Ingenieros de datos
  • Profesionales de DevOps
  • Desarrolladores de software
 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas