Programa del Curso

Resumen rápido

  • Fuentes de datos
  • Cuidado de los datos
  • Sistemas de recomendación
  • Objetivo Marketing

Datatypes

  • Estructurado vs no estructurado
  • Estático vs transmitido
  • Datos actitudinales, conductuales y demográficos
  • Analítica basada en datos frente a analítica impulsada por el usuario
  • Validez de los datos
  • Volumen, velocidad y variedad de datos

Modelos

  • Modelos de construcción
  • Modelos estadísticos
  • Aprendizaje automático

Clasificación de datos

  • Agrupamiento
  • kGroups, k-means, los vecinos más cercanos
  • Colonias de hormigas, bandadas de pájaros

Modelos predictivos

  • Árboles de decisión
  • Máquina de vectores de soporte
  • Clasificación Bayes ingenua
  • Redes neuronales
  • Modelo Markov
  • Regresión
  • Métodos de conjunto

REY

  • Relación beneficio/costo
  • Costo del software
  • Costo de desarrollo
  • Beneficios potenciales

Modelos de construcción

  • Preparación de datos (MapReduce)
  • Limpieza de datos
  • Elección de métodos
  • Desarrollo del modelo
  • Modelo de prueba
  • Evaluación del modelo
  • Implementación e integración de modelos

Visión general del software comercial y de código abierto

  • Selección del paquete R-project
  • Python Bibliotecas
  • Hadoop y Mahout
  • Proyectos Apache seleccionados relacionados con Big Data y Analytics
  • Solución comercial seleccionada
  • Integración con el software y las fuentes de datos existentes

Requerimientos

Comprensión de los métodos tradicionales de gestión y análisis de datos como SQL, almacenes de datos, inteligencia empresarial, OLAP, etc. Comprensión de la estadística básica y la probabilidad (media, varianza, probabilidad, probabilidad condicional, etc.)

 21 horas

Número de participantes



Precio por participante

Testimonios (1)

Categorías Relacionadas