Programa del Curso

Introducción
    Por qué y cómo los equipos de proyecto adoptan Hadoop.
    Como empezó todo
    El rol del Project Manager en los proyectos de Hadoop

Comprender la arquitectura y los conceptos clave de Hadoop
    HDFS
    Mapa reducido
    Otras piezas del ecosistema Hadoop

¿Qué constituye Big Data?

Diferentes enfoques para almacenar Big Data

HDFS (Hadoop Distributed File System) como la base

Cómo se procesa Big Data
    El poder del procesamiento distribuido

Procesando datos con Map Reduce
    Cómo se recogen los datos paso a paso

El papel de la agrupación en el procesamiento distribuido a gran escala
    Descripción arquitectónica
    Enfoques de agrupamiento

Agrupar sus datos y procesos con YARN

El papel de la base de datos no relacional en el almacenamiento de Big Data

Trabajando con la base de datos no relacional de Hadoop: HBase

Descripción general de arquitectura de almacenamiento de datos

Administrar su almacén de datos con Hive

Ejecutar Hadoop desde scripts de shell

Trabajando con Hadoop Streaming

Otras herramientas y utilidades de Hadoop

Comenzando en un proyecto de Hadoop
    Desmitificando la complejidad

Migrar un proyecto existente a Hadoop
    Consideraciones de infraestructura
    Escalar más allá de sus recursos asignados

Las partes interesadas del proyecto Hadoop y sus herramientas
    Desarrolladores, científicos de datos, analistas de negocios y gerentes de proyecto

Hadoop como base para nuevas tecnologías y enfoques

Observaciones finales

Requerimientos

  • Una comprensión general de la programación
  • Una comprensión de las bases de datos
  • Conocimiento básico de Linux
 14 horas

Número de participantes



Precio por participante

Testimonios (5)

Cursos Relacionados

Hortonworks Data Platform (HDP) para Administradores

21 horas

Apache Ambari: Administre de manera eficiente los clústeres de Hadoop

21 horas

Impala para Inteligencia Empresarial

21 horas

Análisis de Datos con Hive / HiveQL

7 horas

Capacitación de Administrador para Apache Hadoop

35 horas

Big Data Analytics in Health

21 horas

Datameer para Analistas de Datos

14 horas

Administración de Hadoop

21 horas

Hadoop para Administradores

21 horas

Hadoop para Desarrolladores (4 días)

28 horas

Hadoop Avanzado para Desarrolladores

21 horas

Hadoop para Desarrolladores y Administradores

21 horas

Administración de Hadoop en MapR

28 horas

Hadoop con Python

28 horas

Hadoop and Spark for Administrators

35 horas

Categorías Relacionadas