Temario del curso
Introducción al aprendizaje automático
- Tipos de aprendizaje automático: supervisado vs. no supervisado.
- De la estadística al aprendizaje automático.
- El flujo de trabajo de minería de datos: comprensión del negocio, preparación de datos, modelado y despliegue.
- Selección del algoritmo adecuado para la tarea.
- Sobreajuste y el equilibrio entre sesgo y varianza.
Panorama de Python y bibliotecas de aprendizaje automático
- Por qué utilizar lenguajes de programación para aprendizaje automático.
- Elección entre R y Python.
- Curso intensivo de Python y Jupyter Notebooks.
- Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn.
Prueba y evaluación de algoritmos de aprendizaje automático
- Generalización, sobreajuste y validación de modelos.
- Estrategias de evaluación: holdout, validación cruzada, bootstrapping.
- Métricas para regresión: ME, MSE, RMSE, MAPE.
- Métricas para clasificación: precisión, matriz de confusión, clases desbalanceadas.
- Visualización del rendimiento del modelo: curva de beneficios, curva ROC, curva de ascenso.
- Selección de modelos y búsqueda en cuadrícula para ajuste.
Preparación de datos
- Importación y almacenamiento de datos en Python.
- Análisis exploratorio y estadísticas descriptivas.
- Manejo de valores faltantes y valores atípicos.
- Estandarización, normalización y transformación.
- Recodificación de datos cualitativos y manipulación de datos con pandas.
Algoritmos de clasificación
- Clasificación binaria vs. multiclase.
- Regresión logística y funciones discriminantes.
- Naïve Bayes, k-vecinos más cercanos.
- Árboles de decisión: CART, Random Forests, Bagging, Boosting, XGBoost.
- Máquinas de soporte vectorial y kernels.
- Técnicas de aprendizaje en conjunto.
Regresión y predicción numérica
- Mínimos cuadrados y selección de variables.
- Métodos de regularización: L1, L2.
- Regresión polinómica y modelos no lineales.
- Árboles de regresión y splines.
Redes neuronales
- Introducción a las redes neuronales y el aprendizaje profundo.
- Funciones de activación, capas y retropropagación.
- Perceptrones multicapa (MLP).
- Uso de TensorFlow o PyTorch para modelado básico de redes neuronales.
- Redes neuronales para clasificación y regresión.
Pronóstico de ventas y análisis predictivo
- Pronóstico basado en series de tiempo vs. regresión.
- Manejo de datos estacionales y basados en tendencias.
- Construcción de un modelo de pronóstico de ventas utilizando técnicas de aprendizaje automático.
- Evaluación de la precisión e incertidumbre del pronóstico.
- Interpretación comercial y comunicación de los resultados.
Aprendizaje no supervisado
- Técnicas de agrupamiento: k-means, k-medoids, agrupamiento jerárquico, SOMs.
- Reducción de dimensionalidad: PCA, análisis factorial, SVD.
- Escalamiento multidimensional.
Minería de texto
- Preprocesamiento y tokenización de texto.
- Bolsa de palabras, stemming y lematización.
- Análisis de sentimientos y frecuencia de palabras.
- Visualización de datos de texto con nubes de palabras.
Sistemas de recomendación
- Filtrado colaborativo basado en usuarios y en ítems.
- Diseño y evaluación de motores de recomendación.
Minería de patrones de asociación
- Conjuntos de elementos frecuentes y algoritmo Apriori.
- Análisis de canasta de mercado y ratio de ascenso.
Detección de valores atípicos
- Análisis de valores extremos.
- Métodos basados en distancia y densidad.
- Detección de valores atípicos en datos de alta dimensionalidad.
Estudio de caso de aprendizaje automático
- Comprensión del problema de negocio.
- Preprocesamiento de datos e ingeniería de características.
- Selección de modelos y ajuste de parámetros.
- Evaluación y presentación de hallazgos.
- Despliegue.
Resumen y siguientes pasos
Requerimientos
- Conocimientos básicos de conceptos de aprendizaje automático, como aprendizaje supervisado y no supervisado.
- Familiaridad con la programación en Python (variables, bucles, funciones).
- Es útil, aunque no obligatorio, contar con cierta experiencia en el manejo de datos utilizando bibliotecas como pandas o NumPy.
- No se requiere experiencia previa en modelado avanzado o redes neuronales.
Público objetivo
- Científicos de datos.
- Analistas de negocios.
- Ingenieros de software y profesionales técnicos que trabajan con datos.
Testimonios (2)
el ecosistema de ML no solo incluye MLFlow sino también Optuna, hyperops, Docker y docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Curso - MLflow
Traducción Automática
Disfruté participando en el entrenamiento de Kubeflow, que se llevó a cabo de manera remota. Este entrenamiento me permitió consolidar mi conocimiento sobre los servicios de AWS, K8s y todas las herramientas de DevOps relacionadas con Kubeflow, que son las bases necesarias para abordar el tema adecuadamente. Quiero agradecer a Malawski Marcin por su paciencia y profesionalismo en la formación y los consejos sobre mejores prácticas. Malawski aborda el tema desde diferentes ángulos, utilizando diferentes herramientas de despliegue como Ansible, EKS kubectl y Terraform. Ahora estoy definitivamente convencido de que me dirijo hacia el campo de aplicación correcto.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Curso - Kubeflow
Traducción Automática