Contacta con nosotros

Temario del curso

Resumen rápido

  • Fuentes de datos
  • Tratamiento de datos
  • Sistemas de recomendación
  • Marketing dirigido

Tipos de datos

  • Estructurados vs no estructurados
  • Estáticos vs en flujo
  • Datos actitudinales, conductuales y demográficos
  • Análisis impulsados por datos vs impulsados por usuarios
  • Validez de los datos
  • Volumen, velocidad y variedad de los datos

Modelos

  • Construcción de modelos
  • Modelos estadísticos
  • Aprendizaje automático

Clasificación de datos

  • Clustering
  • kGrupos, k-medias, los vecinos más cercanos
  • Colonias de hormigas, bandadas de aves

Modelos predictivos

  • Árboles de decisión
  • Máquinas de vectores de soporte
  • Clasificación Naive Bayes
  • Redes neuronales
  • Modelo de Markov
  • Regresión
  • Métodos de conjunto

ROI (Retorno de inversión)

  • Relación beneficio/costo
  • Costo del software
  • Costo de desarrollo
  • Beneficios potenciales

Construcción de modelos

  • Preparación de datos (MapReduce)
  • Limpieza de datos
  • Selección de métodos
  • Desarrollo del modelo
  • Prueba del modelo
  • Evaluación del modelo
  • Implementación e integración del modelo

Resumen de software de código abierto y comercial

  • Selección de paquetes del proyecto R
  • Librerías de Python
  • Hadoop y Mahout
  • Proyectos seleccionados de Apache relacionados con Big Data y análisis
  • Soluciones comerciales seleccionadas
  • Integración con software y fuentes de datos existentes

Requerimientos

Se requiere comprensión de métodos tradicionales de gestión y análisis de datos, como SQL, almacenes de datos, inteligencia de negocios, OLAP, etc. También es necesario tener conocimientos básicos de estadística y probabilidad (media, varianza, probabilidad, probabilidad condicional, etc.).

 21 Horas

Número de participantes


Precio por participante

Testimonios (2)

Próximos cursos

Categorías Relacionadas