Contacta con nosotros

Temario del curso

Sección 1: Gestión de datos en HDFS

  • Varios formatos de datos (JSON / Avro / Parquet)
  • Esquemas de compresión
  • Enmascaramiento de datos
  • Laboratorios: análisis de diferentes formatos de datos; habilitación de compresión

Sección 2: Pig Avanzado

  • Funciones definidas por el usuario
  • Introducción a las bibliotecas de Pig (ElephantBird / Data-Fu)
  • Carga de datos estructurados complejos usando Pig
  • Afinamiento de Pig
  • Laboratorios: scripting avanzado en Pig, análisis de tipos de datos complejos

Sección 3: Hive Avanzado

  • Funciones definidas por el usuario
  • Tablas comprimidas
  • Afinamiento del rendimiento de Hive
  • Laboratorios: creación de tablas comprimidas, evaluación de formatos de tabla y configuración

Sección 4: HBase Avanzado

  • Modelado de esquemas avanzado
  • Compresión
  • Ingesta masiva de datos
  • Comparación entre tablas anchas y tablas altas
  • HBase y Pig
  • HBase y Hive
  • Afinamiento del rendimiento de HBase
  • Laboratorios: afinamiento de HBase; acceso a datos de HBase desde Pig y Hive; uso de Phoenix para el modelado de datos

Requerimientos

  • Dominio del lenguaje de programación Java (la mayoría de los ejercicios de programación se realizan en Java)
  • Familiaridad con el entorno Linux (capacidad para navegar por la línea de comandos de Linux y editar archivos usando vi / nano)
  • Conocimientos funcionales de Hadoop.

Entorno de laboratorio

Cero instalación: ¡No es necesario instalar el software de Hadoop en las máquinas de los estudiantes! Se proporcionará un clúster de Hadoop funcional para los participantes.

Los estudiantes necesitarán lo siguiente

 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas