Contacta con nosotros

Temario del curso

Introducción al aprendizaje automático

  • Tipos de aprendizaje automático: supervisado frente a no supervisado
  • Del aprendizaje estadístico al aprendizaje automático
  • El flujo de trabajo de minería de datos: comprensión empresarial, preparación de datos, modelado y despliegue
  • Elección del algoritmo adecuado para cada tarea
  • Sobreajuste y la compensación entre sesgo y varianza

Visión general de Python y bibliotecas de aprendizaje automático

  • Por qué usar lenguajes de programación para aprendizaje automático
  • Elección entre R y Python
  • Curso intensivo de Python y cuadernos Jupyter
  • Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Pruebas y evaluación de algoritmos de aprendizaje automático

  • Generalización, sobreajuste y validación de modelos
  • Estrategias de evaluación: conjunto de prueba, validación cruzada y bootstrapping
  • Métricas para regresión: ME, MSE, RMSE, MAPE
  • Métricas para clasificación: precisión, matriz de confusión y clases desbalanceadas
  • Visualización del rendimiento del modelo: curva de beneficio, curva ROC y curva de elevación
  • Selección de modelos y búsqueda en cuadrícula para ajuste de parámetros

Preparación de datos

  • Importación y almacenamiento de datos en Python
  • Análisis exploratorio y estadísticas resumidas
  • Manejo de valores faltantes y valores atípicos
  • Estandarización, normalización y transformación
  • Recodificación de datos cualitativos y manipulación de datos con pandas

Algoritmos de clasificación

  • Clasificación binaria frente a multiclase
  • Regresión logística y funciones discriminantes
  • Naïve Bayes, k-vecinos más cercanos
  • Árboles de decisión: CART, Random Forests, Bagging, Boosting, XGBoost
  • Máquinas de vectores de soporte y funciones de kernel
  • Técnicas de aprendizaje por conjuntos

Regresión y predicción numérica

  • Mínimos cuadrados y selección de variables
  • Métodos de regularización: L1, L2
  • Regresión polinómica y modelos no lineales
  • Árboles de regresión y splines

Aprendizaje no supervisado

  • Técnicas de agrupamiento: k-means, k-medoides, agrupamiento jerárquico y SOMs
  • Reducción de dimensionalidad: PCA, análisis factorial y SVD
  • Escalamiento multidimensional

Minería de texto

  • Preprocesamiento y tokenización de texto
  • Bolsa de palabras, stemming y lematización
  • Análisis de sentimiento y frecuencia de palabras
  • Visualización de datos de texto con nubes de palabras

Sistemas de recomendación

  • Filtrado colaborativo basado en usuarios y en elementos
  • Diseño y evaluación de motores de recomendación

Minería de patrones de asociación

  • Conjuntos de elementos frecuentes y algoritmo Apriori
  • Análisis de canastas de mercado y ratio de elevación

Detección de valores atípicos

  • Análisis de valores extremos
  • Métodos basados en distancia y densidad
  • Detección de valores atípicos en datos de alta dimensionalidad

Estudio de caso de aprendizaje automático

  • Comprensión del problema empresarial
  • Preprocesamiento de datos e ingeniería de características
  • Selección de modelos y ajuste de parámetros
  • Evaluación y presentación de hallazgos
  • Despliegue

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de estadística y álgebra lineal
  • Familiaridad con conceptos de análisis de datos o inteligencia empresarial
  • Se recomienda tener alguna experiencia en programación (preferiblemente en Python o R)
  • Interés en aprender sobre aprendizaje automático aplicado a proyectos basados en datos

Público objetivo

  • Analistas y científicos de datos
  • Estadísticos y profesionales de investigación
  • Desarrolladores y profesionales de TI que exploran herramientas de aprendizaje automático
  • Cualquier persona involucrada en proyectos de ciencia de datos o análisis predictivo
 21 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas