Contacta con nosotros

Temario del curso

Introducción

  • El proceso de la ciencia de datos
  • Roles y responsabilidades de un científico de datos

Preparación del entorno de desarrollo

  • Bibliotecas, frameworks, lenguajes y herramientas
  • Desarrollo local
  • Desarrollo colaborativo basado en la web

Recopilación de datos

  • Diferentes tipos de datos
    • Estructurados
      • Bases de datos locales
      • Conectores de bases de datos
      • Formatos comunes: xlxs, XML, Json, csv, ...
    • No estructurados
      • Clics, sensores, teléfonos inteligentes
      • APIs
      • Internet de las cosas (IoT)
      • Documentos, imágenes, videos, sonidos
  • Estudio de caso: Recopilación continua de grandes volúmenes de datos no estructurados

Almacenamiento de datos

  • Bases de datos relacionales
  • Bases de datos no relacionales
  • Hadoop: Sistema de archivos distribuido (HDFS)
  • Spark: Conjunto de datos distribuido resistente (RDD)
  • Almacenamiento en la nube

Preparación de datos

  • Ingesta, selección, limpieza y transformación
  • Garantizar la calidad de los datos: corrección, relevancia y seguridad
  • Informes de excepciones

Lenguajes utilizados para la preparación, procesamiento y análisis

  • Lenguaje R
    • Introducción a R
    • Manipulación de datos, cálculos y representación gráfica
  • Python
    • Introducción a Python
    • Manipulación, procesamiento, limpieza y análisis exhaustivo de datos

Análisis de datos

  • Análisis exploratorio
    • Estadística básica
    • Visualizaciones preliminares
    • Comprensión de los datos
  • Causalidad
  • Características y transformaciones
  • Aprendizaje automático
    • Aprendizaje supervisado vs. no supervisado
    • Cuándo utilizar cada modelo
  • Procesamiento del lenguaje natural (NLP)

Visualización de datos

  • Mejores prácticas
  • Selección del gráfico adecuado para cada tipo de dato
  • Paletas de colores
  • Llevarlo al siguiente nivel
    • Paneles de control
    • Visualizaciones interactivas
  • Contar historias con datos

Resumen y conclusión

Requerimientos

  • Conocimientos generales sobre conceptos de bases de datos
  • Comprensión básica de estadística
 35 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas