Inicio
Big Data Formación
Hadoop Formación
Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Apache Hadoop es el framework más popular para procesar Big Data en clústeres de servidores. Este curso introducirá a un desarrollador a diversos componentes (HDFS, MapReduce, Pig, Hive y HBase) del ecosistema Hadoop.

Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Temario del curso

Sección 1: Introducción a Hadoop

Historia y conceptos de Hadoop
Ecosistema
Distribuciones
Arquitectura de alto nivel
Mitos sobre Hadoop
Desafíos de Hadoop
Hardware y software
Laboratorio: primer acercamiento a Hadoop

Sección 2: HDFS

Diseño y arquitectura
Conceptos (escalabilidad horizontal, replicación, localidad de datos, conciencia de rack)
Daemon: Namenode, Secondary Namenode, DataNode
Comunicaciones y latidos (heartbeats)
Integridad de los datos
Proceso de lectura y escritura
Alta disponibilidad (HA) y federación de Namenode
Laboratorios: Interacción con HDFS

Sección 3: MapReduce

Conceptos y arquitectura
Daemon (MRV1): JobTracker y TaskTracker
Fases: driver, mapper, shuffle/sort, reducer
MapReduce versión 1 y versión 2 (YARN)
Internos de MapReduce
Introducción al programa MapReduce en Java
Laboratorios: Ejecución de un programa de ejemplo de MapReduce

Sección 4: Pig

Pig frente a Java MapReduce
Flujo de trabajo de Pig
Lenguaje Pig Latin
ETL con Pig
Transformaciones y uniones (joins)
Funciones definidas por el usuario (UDF)
Laboratorios: Escritura de scripts en Pig para analizar datos

Sección 5: Hive

Arquitectura y diseño
Tipos de datos
Soporte SQL en Hive
Creación de tablas en Hive y consultas
Particiones
Uniones (joins)
Procesamiento de texto
Laboratorios: Varios laboratorios sobre procesamiento de datos con Hive

Sección 6: HBase

Conceptos y arquitectura
HBase frente a RDBMS y Cassandra
API de Java para HBase
Datos de series temporales en HBase
Diseño de esquemas
Laboratorios: Interacción con HBase usando la consola; programación con la API de Java de HBase; ejercicio de diseño de esquemas

Requerimientos

dominio del lenguaje de programación Java (la mayoría de los ejercicios prácticos se realizan en Java)
familiaridad con el entorno Linux (capacidad para navegar por la línea de comandos de Linux y editar archivos usando vi / nano)

Entorno de laboratorio

Instalación cero: ¡No es necesario instalar el software de Hadoop en las máquinas de los estudiantes! Se proporcionará un clúster de Hadoop funcional para los estudiantes.

Los estudiantes necesitarán lo siguiente:

un cliente SSH (Linux y Mac ya incluyen clientes SSH; para Windows se recomienda PuTTY)
un navegador para acceder al clúster; se recomienda Firefox

28 Horas

Número de participantes

En línea

Presencial

Seleccione el lugar

Seleccione un lugar

Precio por participante

Los cursos públicos requieren más de 5 participantes.

Hadoop para Desarrolladores (4 días) - Reserva

Nombre completo *

Correo electrónico *

Teléfono *

Título Profesional

Nombre de la Empresa

Dirección 1 *

Ciudad *

Estado / Provincia

País *

Código Postal *

Fecha de Inicio

Identificación Fiscal

Las fechas están sujetas a disponibilidad y tendrán lugar entre 09:30 y 16:30.

Pago *

Transferencia Bancaria (Factura, OC)

Débito / Tarjeta de Crédito

Comentarios

Términos y Condiciones *

Soy un representante autorizado del cliente arriba mencionado y deseo reservar los cursos o servicios arriba mencionados de acuerdo con los Términos y Condiciones y la Política de Privacidad de NobleProg.

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Hadoop para Desarrolladores (4 días) - Consulta

Nombre completo *

Correo electrónico *

Teléfono *

Número de participantes

Nombre de la Empresa

Dirección de la Compañía

¿Cómo quiere hacer el curso?

Instalaciones del Cliente

En línea

Presencial

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Hadoop para Desarrolladores (4 días) - Solicitud de consultoría

Nombre completo *

Teléfono *

Correo electrónico *

Nombre de la Empresa

Asunto de la consulta *

Consulta sobre el Objetivo

¿Con quién va a trabajar el consultor?

Consulta Urgente *

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Testimonios (1)

Ejercicios prácticos. La clase debería haber durado 5 días, pero los 3 días fueron útiles para aclarar muchas de las preguntas que tenía al trabajar con NiFi.

James - BHG Financial

Curso - Apache NiFi for Administrators

11275 USD (En línea)

13275 USD (Presencial)

Cursos Relacionados

Capacitación de Administrador para Apache Hadoop

35 Horas

Público objetivo:

Este curso está diseñado para especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en entornos de sistemas distribuidos.

Objetivo:

Adquirir un conocimiento profundo sobre la administración de clústeres Hadoop.

Análisis de Big Data en Salud

21 Horas

El análisis de big data consiste en examinar grandes volúmenes de conjuntos de datos diversos para descubrir correlaciones, patrones ocultos y otras ideas útiles.

La industria de la salud cuenta con cantidades masivas de datos médicos y clínicos complejos y heterogéneos. Aplicar análisis de big data a datos de salud ofrece un gran potencial para obtener información que mejore la prestación de servicios de atención médica. Sin embargo, la magnitud de estos conjuntos de datos presenta grandes desafíos para el análisis y su aplicación práctica en entornos clínicos.

En esta capacitación en vivo, impartida por un instructor (a distancia), los participantes aprenderán a realizar análisis de big data en el ámbito de la salud mientras trabajan en una serie de ejercicios prácticos en laboratorios en vivo.

Al finalizar esta capacitación, los participantes serán capaces de:

Instalar y configurar herramientas de análisis de big data, como Hadoop MapReduce y Spark.
Comprender las características de los datos médicos.
Aplicar técnicas de big data para manejar datos médicos.
Estudiar sistemas y algoritmos de big data en el contexto de aplicaciones de salud.

Público objetivo

Desarrolladores.
Científicos de datos.

Formato del curso

Parte de clase magistral, parte de discusión, ejercicios y práctica intensiva.

Nota

Para solicitar una capacitación personalizada para este curso, por favor contáctenos para coordinar.

Hadoop para Administradores

21 Horas

Apache Hadoop es el framework más popular para procesar Big Data en clústeres de servidores. En este curso de tres días (opcionalmente cuatro), los participantes aprenderán sobre los beneficios empresariales y los casos de uso de Hadoop y su ecosistema, cómo planificar el despliegue y el crecimiento del clúster, así como cómo instalar, mantener, monitorear, solucionar problemas y optimizar Hadoop. Además, practicarán la carga masiva de datos en el clúster, se familiarizarán con diversas distribuciones de Hadoop y ejercitarán la instalación y gestión de herramientas del ecosistema. El curso finalizará con un debate sobre la seguridad del clúster mediante Kerberos.

"…El material estaba muy bien preparado y cubría todos los temas de forma exhaustiva. El laboratorio fue muy útil y estaba muy bien organizado"
— Andrew Nguyen, Ingeniero Principal de Integración DW, Microsoft Online Advertising

Público objetivo

Administradores de Hadoop

Formato

Clases teóricas y laboratorios prácticos, con una distribución aproximada del 60% de teoría y el 40% de práctica.

Hadoop Avanzado para Desarrolladores

21 Horas

Apache Hadoop es uno de los marcos de trabajo más populares para procesar Big Data en clústeres de servidores. Este curso profundiza en la gestión de datos en HDFS, así como en Pig, Hive y HBase avanzados. Estas técnicas de programación avanzada serán beneficiosas para desarrolladores de Hadoop con experiencia.

Público objetivo: desarrolladores

Duración: tres días

Formato: clases magistrales (50%) y laboratorios prácticos (50%).

Administración de Hadoop en MapR

28 Horas

Público objetivo:

Este curso tiene como objetivo desmitificar la tecnología de big data y Hadoop, demostrando que su comprensión no es difícil.

Hadoop y Spark para administradores

35 Horas

Esta capacitación impartida por un instructor, en vivo en Colombia (en línea o presencial), está dirigida a administradores de sistemas que desean aprender a configurar, implementar y gestionar clústeres de Hadoop dentro de su organización.

Al finalizar esta capacitación, los participantes podrán:

Instalar y configurar Apache Hadoop.
Comprender los cuatro componentes principales del ecosistema de Hadoop: HDFS, MapReduce, YARN y Hadoop Common.
Utilizar el Sistema de Archivos Distribuido de Hadoop (HDFS) para escalar un clúster a cientos o miles de nodos.
Configurar HDFS para que funcione como motor de almacenamiento en implementaciones locales de Spark.
Configurar Spark para acceder a soluciones de almacenamiento alternativas, como Amazon S3 y sistemas de bases de datos NoSQL como Redis, Elasticsearch, Couchbase, Aerospike, entre otros.
Realizar tareas administrativas como el aprovisionamiento, gestión, monitoreo y seguridad de un clúster de Apache Hadoop.

HBase para Desarrolladores

21 Horas

Este curso introduce HBase, una base de datos NoSQL construida sobre Hadoop. Está diseñado para desarrolladores que utilizarán HBase en el desarrollo de aplicaciones y para administradores encargados de gestionar clústeres de HBase.

Guiaremos a los desarrolladores a través de la arquitectura de HBase, el modelado de datos y el desarrollo de aplicaciones sobre HBase. También se abordará el uso de MapReduce con HBase, así como temas de administración relacionados con la optimización del rendimiento. El curso es altamente práctico, con numerosas sesiones de laboratorio.

Duración: 3 días

Público objetivo: Desarrolladores y administradores

Apache NiFi para administradores

21 Horas

Apache NiFi es una plataforma de código abierto para la integración de datos basada en flujos y el procesamiento de eventos. Permite el enrutamiento, la transformación y la mediación de datos en tiempo real entre sistemas dispares, automatizados, con una interfaz web y un control detallado.

Esta formación presencial o remota, impartida por un instructor, está dirigida a administradores e ingenieros de nivel intermedio que deseen desplegar, gestionar, asegurar y optimizar flujos de datos de NiFi en entornos de producción.

Al finalizar esta formación, los participantes podrán:

Instalar, configurar y mantener clústeres de Apache NiFi.
Diseñar y gestionar flujos de datos provenientes de diversas fuentes y destinos.
Implementar lógica de automatización, enrutamiento y transformación de flujos.
Optimizar el rendimiento, monitorear operaciones y solucionar problemas.

Formato del Curso

Clases interactivas con discusión de arquitecturas del mundo real.
Prácticas guiadas: construcción, despliegue y gestión de flujos.
Ejercicios basados en escenarios en un entorno de laboratorio en vivo.

Opciones de Personalización del Curso

Para solicitar una capacitación personalizada para este curso, por favor contáctenos para coordinarlo.

Apache NiFi para desarrolladores

7 Horas

En esta capacitación presencial impartida por un instructor en Colombia, los participantes aprenderán los fundamentos de la programación basada en flujos mientras desarrollan diversas extensiones, componentes y procesadores de demostración utilizando Apache NiFi.

Al finalizar esta capacitación, los participantes podrán:

Comprender la arquitectura de NiFi y los conceptos de flujo de datos.
Desarrollar extensiones utilizando NiFi y APIs de terceros.
Desarrollar de forma personalizada su propio procesador de Apache NiFi.
Ingresar y procesar datos en tiempo real provenientes de formatos de archivo y fuentes de datos diversos e inusuales.

Python, Spark y Hadoop para Big Data

21 Horas

Esta formación presencial, impartida por un instructor en Colombia (en línea o in situ), está dirigida a desarrolladores que deseen utilizar e integrar Spark, Hadoop y Python para procesar, analizar y transformar conjuntos de datos grandes y complejos.

Al finalizar esta formación, los participantes serán capaces de:

Configurar el entorno necesario para comenzar a procesar big data con Spark, Hadoop y Python.
Comprender las características, componentes centrales y arquitectura de Spark y Hadoop.
Aprender a integrar Spark, Hadoop y Python para el procesamiento de big data.
Explorar las herramientas del ecosistema de Spark (Spark MLlib, Spark Streaming, Kafka, Sqoop, Kafka y Flume).
Construir sistemas de recomendación basados en filtrado colaborativo similares a los de Netflix, YouTube, Amazon, Spotify y Google.
Utilizar Apache Mahout para escalar algoritmos de aprendizaje automático.

Hadoop para Desarrolladores (4 días)

Temario del curso

Sección 1: Introducción a Hadoop

Sección 2: HDFS

Sección 3: MapReduce

Sección 4: Pig

Sección 5: Hive

Sección 6: HBase

Requerimientos

Entorno de laboratorio

Testimonios (1)

James - BHG Financial

Curso - Apache NiFi for Administrators

Próximos cursos

Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites