Contacta con nosotros

Temario del curso

  1. Fundamentos del Big Data
    • El Big Data y su rol en el entorno corporativo
    • Fases de desarrollo de una estrategia de Big Data dentro de una corporación
    • Explicar la lógica que fundamenta un enfoque integral del Big Data
    • Componentes necesarios en una plataforma de Big Data
    • Soluciones de almacenamiento para Big Data
    • Limitaciones de las tecnologías tradicionales
    • Visión general de los tipos de bases de datos
    • Las cuatro dimensiones del Big Data
  2. Impacto del Big Data en los negocios
    • Importancia empresarial del Big Data
    • Desafíos en la extracción de datos útiles
    • Integración del Big Data con datos tradicionales
  3. Tecnologías de almacenamiento para Big Data
    • Visión general de las tecnologías de Big Data
      • Modelos de almacenamiento de datos
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Selección de la tecnología de Big Data adecuada
  4. Procesamiento de Big Data
    • Conexión y extracción de datos desde bases de datos
    • Transformación y preparación de datos para su procesamiento
    • Uso de Hadoop MapReduce para procesar datos distribuidos
    • Monitoreo y ejecución de trabajos de Hadoop MapReduce
    • Componentes fundamentales del sistema de archivos distribuido de Hadoop
    • MapReduce y YARN
    • Manejo de datos en flujo con Spark
  5. Herramientas y tecnologías de análisis de Big Data
    • Programación de Hadoop con el lenguaje Pig Latin
    • Consulta de Big Data con Hive
    • Minería de datos con Mahout
    • Herramientas de visualización e informes
  6. Big Data en los negocios
    • Gestión y definición de las necesidades de Big Data
    • Importancia empresarial del Big Data
    • Selección de las herramientas de Big Data adecuadas para el problema

Conceptos de Almacén de Datos (Data Warehousing)

  • ¿Qué es un almacén de datos?
  • Diferencias entre OLTP y almacén de datos
  • Adquisición de datos
  • Extracción de datos
  • Transformación de datos
  • Carga de datos
  • Martillos de datos (Data Marts)
  • Martillos de datos dependientes vs. independientes
  • Diseño de bases de datos

Conceptos de pruebas ETL:

  • Introducción
  • Ciclo de vida del desarrollo de software
  • Metodologías de prueba
  • Proceso de flujo de trabajo de pruebas ETL
  • Responsabilidades en las pruebas ETL durante la fase de datos

Fundamentos del Big Data

  • El Big Data y su rol en el entorno corporativo
  • Fases de desarrollo de una estrategia de Big Data dentro de una corporación
  • Explicar la lógica que fundamenta un enfoque integral del Big Data
  • Componentes necesarios en una plataforma de Big Data
  • Soluciones de almacenamiento para Big Data
  • Limitaciones de las tecnologías tradicionales
  • Visión general de los tipos de bases de datos

Bases de datos NoSQL

Hadoop

MapReduce

Apache Spark

Requerimientos

Los participantes deben tener conocimiento y alguna experiencia en el uso de herramientas de almacenamiento, así como familiaridad con el manejo de grandes conjuntos de datos

 14 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas