Programa del Curso
Introducción
Por qué y cómo los equipos de proyecto adoptan Hadoop.
Como empezó todo
El rol del Project Manager en los proyectos de Hadoop
Comprender la arquitectura y los conceptos clave de Hadoop
HDFS
Mapa reducido
Otras piezas del ecosistema Hadoop
¿Qué constituye Big Data?
Diferentes enfoques para almacenar Big Data
HDFS (Hadoop Distributed File System) como la base
Cómo se procesa Big Data
El poder del procesamiento distribuido
Procesando datos con Map Reduce
Cómo se recogen los datos paso a paso
El papel de la agrupación en el procesamiento distribuido a gran escala
Descripción arquitectónica
Enfoques de agrupamiento
Agrupar sus datos y procesos con YARN
El papel de la base de datos no relacional en el almacenamiento de Big Data
Trabajando con la base de datos no relacional de Hadoop: HBase
Descripción general de arquitectura de almacenamiento de datos
Administrar su almacén de datos con Hive
Ejecutar Hadoop desde scripts de shell
Trabajando con Hadoop Streaming
Otras herramientas y utilidades de Hadoop
Comenzando en un proyecto de Hadoop
Desmitificando la complejidad
Migrar un proyecto existente a Hadoop
Consideraciones de infraestructura
Escalar más allá de sus recursos asignados
Las partes interesadas del proyecto Hadoop y sus herramientas
Desarrolladores, científicos de datos, analistas de negocios y gerentes de proyecto
Hadoop como base para nuevas tecnologías y enfoques
Observaciones finales
Requerimientos
- Una comprensión general de la programación
- Una comprensión de las bases de datos
- Conocimiento básico de Linux
Testimonios (5)
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Curso - Impala for Business Intelligence
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Curso - Big Data Analytics in Health
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Curso - Data Analysis with Hive/HiveQL
I genuinely enjoyed the many hands-on sessions.
Jacek Pieczątka
Curso - Administrator Training for Apache Hadoop
The fact that all the data and software was ready to use on an already prepared VM, provided by the trainer in external disks.