Temario del curso
Fundamentos de Python para tareas de datos
- Instalación de Python y configuración del entorno de desarrollo.
- Fundamentos del lenguaje: variables, tipos de datos, estructuras de control.
- Escribir y ejecutar scripts sencillos en Python.
Manejo de archivos: CSV y Excel
- Lectura y escritura de archivos CSV usando el módulo csv y Pandas.
- Trabajo con archivos Excel usando openpyxl/xlrd y Pandas.
- Ejercicios prácticos: automatización de conversiones de archivos.
Introducción a Pandas
- Conceptos básicos de DataFrame: creación, indexación, selección y filtrado.
- Operaciones de agregación y agrupación.
- Operaciones comunes de limpieza: valores faltantes, duplicados y conversiones de tipo.
Introducción a Polars
- Conceptos de Polars y características de rendimiento en comparación con Pandas.
- Operaciones básicas de DataFrame en Polars.
- Ejemplo de caso de uso: cuándo elegir Polars en lugar de Pandas.
Transformación avanzada de datos (Intermedio)
- Uniones complejas, funciones de ventana y operaciones de pivote en Pandas.
- Patrones eficientes de procesamiento de datos con Polars.
- Cadena de operaciones y optimización del uso de memoria.
Automatización de procesos con Python
- Escribir scripts para automatizar tareas repetitivas de datos y pasos ETL.
- Programación de scripts con programadores del sistema operativo o programadores de tareas.
- Registro, manejo de errores y notificaciones.
Empaquetado de scripts y mejores prácticas
- Creación de ejecutables con PyInstaller o herramientas similares.
- Estructura de proyectos, entornos virtuales y gestión de dependencias.
- Conceptos básicos de control de versiones y documentación de flujos de trabajo.
Mini-proyecto práctico
- Tarea integral: leer archivos crudos, limpiar y transformar datos, generar salidas.
- Automatizar el flujo de trabajo y empaquetarlo como un script ejecutable o un programa.
- Revisión y mejoras basadas en retroalimentación de pares.
Resumen y próximos pasos
Requerimientos
- Conocimientos básicos de conceptos de programación o disposición para aprender.
- Comodidad al utilizar la línea de comandos o terminal para la instalación de paquetes.
- Experiencia trabajando con hojas de cálculo (CSV/Excel).
Público objetivo
- Analistas de datos y personal de operaciones que automatizan tareas de datos.
- Ingenieros analíticos que buscan scripting ligero para procesos ETL.
- Profesionales interesados en flujos de trabajo prácticos basados en Python para datos.
Testimonios (2)
Los ejercicios prácticos relacionados con el contenido realmente ayudan a comprender más sobre cada tema. Además, el estilo de comenzar la clase con una conferencia y continuar con ejercicios prácticos es bueno y útil para relacionarlo con la conferencia presentada anteriormente.
Nazeera Mohamad - Ministry of Science, Technology and Innovation
Curso - Introduction to Data Science and AI using Python
Traducción Automática
Ejemplos/ejercicios perfectamente adaptados a nuestro dominio
Luc - CS Group
Curso - Scaling Data Analysis with Python and Dask
Traducción Automática