Contacta con nosotros

Temario del curso

Introducción a Apache Airflow para machine learning

  • Visión general de Apache Airflow y su relevancia para la ciencia de datos
  • Características clave para automatizar flujos de trabajo de machine learning
  • Configuración de Airflow para proyectos de ciencia de datos

Construcción de pipelines de machine learning con Airflow

  • Diseño de DAGs para flujos de trabajo de ML de extremo a extremo
  • Uso de operadores para la ingesta de datos, preprocesamiento y ingeniería de características
  • Programación y gestión de dependencias entre tareas del pipeline

Entrenamiento y validación de modelos

  • Automatización de tareas de entrenamiento de modelos con Airflow
  • Integración de Airflow con frameworks de ML (por ejemplo, TensorFlow, PyTorch)
  • Validación de modelos y almacenamiento de métricas de evaluación

Despliegue y monitoreo de modelos

  • Despliegue de modelos de machine learning mediante pipelines automatizados
  • Monitoreo de modelos desplegados con tareas de Airflow
  • Gestión del reentrenamiento y actualizaciones de modelos

Personalización e integración avanzada

  • Desarrollo de operadores personalizados para tareas específicas de ML
  • Integración de Airflow con plataformas en la nube y servicios de ML
  • Ampliación de flujos de trabajo de Airflow mediante complementos y sensores

Optimización y escalado de pipelines de ML

  • Mejora del rendimiento de flujos de trabajo para datos a gran escala
  • Escalado de implementaciones de Airflow con Celery y Kubernetes
  • Mejores prácticas para flujos de trabajo de ML listos para producción

Casos de estudio y aplicaciones prácticas

  • Ejemplos reales de automatización de ML utilizando Airflow
  • Ejercicio práctico: Construcción de un pipeline de ML de extremo a extremo
  • Debate sobre desafíos y soluciones en la gestión de flujos de trabajo de ML

Resumen y siguientes pasos

Requerimientos

  • Conocimientos básicos de flujos de trabajo y conceptos de machine learning
  • Comprensión fundamental de Apache Airflow, incluyendo DAGs y operadores
  • Dominio de la programación en Python

Público objetivo

  • Científicos de datos
  • Ingenieros de machine learning
  • Desarrolladores de inteligencia artificial
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas