Contacta con nosotros

Temario del curso

Introducción al aprendizaje automático

  • Tipos de aprendizaje automático: supervisado vs. no supervisado.
  • De la estadística al aprendizaje automático.
  • El flujo de trabajo de minería de datos: comprensión del negocio, preparación de datos, modelado y despliegue.
  • Selección del algoritmo adecuado para la tarea.
  • Sobreajuste y el equilibrio entre sesgo y varianza.

Panorama de Python y bibliotecas de aprendizaje automático

  • Por qué utilizar lenguajes de programación para aprendizaje automático.
  • Elección entre R y Python.
  • Curso intensivo de Python y Jupyter Notebooks.
  • Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn.

Prueba y evaluación de algoritmos de aprendizaje automático

  • Generalización, sobreajuste y validación de modelos.
  • Estrategias de evaluación: holdout, validación cruzada, bootstrapping.
  • Métricas para regresión: ME, MSE, RMSE, MAPE.
  • Métricas para clasificación: precisión, matriz de confusión, clases desbalanceadas.
  • Visualización del rendimiento del modelo: curva de beneficios, curva ROC, curva de ascenso.
  • Selección de modelos y búsqueda en cuadrícula para ajuste.

Preparación de datos

  • Importación y almacenamiento de datos en Python.
  • Análisis exploratorio y estadísticas descriptivas.
  • Manejo de valores faltantes y valores atípicos.
  • Estandarización, normalización y transformación.
  • Recodificación de datos cualitativos y manipulación de datos con pandas.

Algoritmos de clasificación

  • Clasificación binaria vs. multiclase.
  • Regresión logística y funciones discriminantes.
  • Naïve Bayes, k-vecinos más cercanos.
  • Árboles de decisión: CART, Random Forests, Bagging, Boosting, XGBoost.
  • Máquinas de soporte vectorial y kernels.
  • Técnicas de aprendizaje en conjunto.

Regresión y predicción numérica

  • Mínimos cuadrados y selección de variables.
  • Métodos de regularización: L1, L2.
  • Regresión polinómica y modelos no lineales.
  • Árboles de regresión y splines.

Redes neuronales

  • Introducción a las redes neuronales y el aprendizaje profundo.
  • Funciones de activación, capas y retropropagación.
  • Perceptrones multicapa (MLP).
  • Uso de TensorFlow o PyTorch para modelado básico de redes neuronales.
  • Redes neuronales para clasificación y regresión.

Pronóstico de ventas y análisis predictivo

  • Pronóstico basado en series de tiempo vs. regresión.
  • Manejo de datos estacionales y basados en tendencias.
  • Construcción de un modelo de pronóstico de ventas utilizando técnicas de aprendizaje automático.
  • Evaluación de la precisión e incertidumbre del pronóstico.
  • Interpretación comercial y comunicación de los resultados.

Aprendizaje no supervisado

  • Técnicas de agrupamiento: k-means, k-medoids, agrupamiento jerárquico, SOMs.
  • Reducción de dimensionalidad: PCA, análisis factorial, SVD.
  • Escalamiento multidimensional.

Minería de texto

  • Preprocesamiento y tokenización de texto.
  • Bolsa de palabras, stemming y lematización.
  • Análisis de sentimientos y frecuencia de palabras.
  • Visualización de datos de texto con nubes de palabras.

Sistemas de recomendación

  • Filtrado colaborativo basado en usuarios y en ítems.
  • Diseño y evaluación de motores de recomendación.

Minería de patrones de asociación

  • Conjuntos de elementos frecuentes y algoritmo Apriori.
  • Análisis de canasta de mercado y ratio de ascenso.

Detección de valores atípicos

  • Análisis de valores extremos.
  • Métodos basados en distancia y densidad.
  • Detección de valores atípicos en datos de alta dimensionalidad.

Estudio de caso de aprendizaje automático

  • Comprensión del problema de negocio.
  • Preprocesamiento de datos e ingeniería de características.
  • Selección de modelos y ajuste de parámetros.
  • Evaluación y presentación de hallazgos.
  • Despliegue.

Resumen y siguientes pasos

Requerimientos

  • Conocimientos básicos de conceptos de aprendizaje automático, como aprendizaje supervisado y no supervisado.
  • Familiaridad con la programación en Python (variables, bucles, funciones).
  • Es útil, aunque no obligatorio, contar con cierta experiencia en el manejo de datos utilizando bibliotecas como pandas o NumPy.
  • No se requiere experiencia previa en modelado avanzado o redes neuronales.

Público objetivo

  • Científicos de datos.
  • Analistas de negocios.
  • Ingenieros de software y profesionales técnicos que trabajan con datos.
 28 Horas

Número de participantes


Precio por participante

Testimonios (2)

Próximos cursos

Categorías Relacionadas