Inicio
cursos big data
cursos hadoop

Cursos de Hadoop para Desarrolladores y Administradores

(1 Testimonios)

Hadoop es el marco de procesamiento de Big Data más popular .

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Programa del Curso

Módulo 1. Introducción a Hadoop

El Hadoop Sistema de archivos distribuido (HDFS)
La ruta de lectura y la ruta de escritura
Administración de metadatos del sistema de archivos
El nodo de nombre y el nodo de datos
La alta disponibilidad de Namenode
Federación de nodos de nombre
Las herramientas de línea de comandos
Descripción de la compatibilidad con REST

Módulo 2. Introducción a MapReduce

Análisis de los datos con Hadoop
Patrón de asignación y reducción
Java MapReduce
Escalado horizontal
Flujo de datos
Desarrollo de funciones de combinador
Ejecución de un trabajo de MapReduce distribuido

Módulo 3. Planificación de un clúster Hadoop

Elegir una distribución y una versión de Hadoop
Versiones y características
Selección de hardware
Selección de hardware maestro y de trabajo
Tamaño del clúster
Selección y preparación del sistema operativo
Diseño de implementación
Configuración de usuarios, grupos y privilegios
Configuración del disco
Diseño de redes

Módulo 4. Instalación y configuración

Instalación de Hadoop
Configuración: Descripción general
Los archivos de configuración de Hadoop XML
Variables de entorno y scripts de shell
Configuración de registro
Administración de HDFS
Optimización y ajuste
Formatear el nodo de nombre
Creación de un directorio /tmp
Pensando en la alta disponibilidad de Namenode
Las opciones de esgrima
Configuración automática de conmutación por error
Formatear y arrancar los nodos de nombre
Federación de nodos de nombre

Módulo 5. Descripción Hadoop de E/S

Integridad de datos en HDFS
Descripción de los códecs
Compresión y divisiones de entrada
Uso de la compresión en MapReduce
El mecanismo de serialización
Estructuras de datos basadas en archivos
El formato SequenceFile
Otros formatos de archivo y formatos orientados a columnas

Módulo 6. Desarrollo de una aplicación MapReduce

La APIde configuración
Configuración del entorno de desarrollo
Administración de la configuración
GenericOptionsParser, Tool y ToolRunner
Escribir una prueba unitaria con MRUnit
El mapeador y el reductor
Ejecución local en datosde prueba
Probar el controlador
Ejecución en un clúster
Empaquetado y lanzamiento de un trabajo
La interfaz de usuario web de MapReduce
Ajuste de un trabajo

Módulo 7. Identidad, autenticación y autorización

Gestión de la identidad
Kerberos y Hadoop
Descripción de la autorización

Módulo 8. Recurso Management

¿Qué es el recurso Management?
Cuotas de HDFS
Programadores de MapReduce
Anatomía de la ejecución de una aplicación YARN
Solicitudes de recursos
Vida útil de la aplicación
YARN en comparación con MapReduce 1
Programación en YARN
Opciones del programador
Configuración del programador de capacidad
Configuración del programador justo
Programación de retrasos
Equidad dominante de los recursos

Módulo 9. Tipos y formatos de MapReduce

Tipos de MapReduce
El trabajo predeterminado de MapReduce
Definición de los formatos de entrada
Gestión de divisiones y registros de entrada
Entrada de texto y entrada binaria
Gestión de varias entradas
Database Entrada (y salida)
Formatos de salida
Salida de texto y salida binaria
Gestión de varias salidas
La salida Database

Módulo 10. Uso de las entidades de MapReduce

Uso de contadores
Lectura de contadores incorporados
Contadores Java definidos por el usuario
Comprender la clasificación
Uso de la caché distribuida

Módulo 11. Mantenimiento y solución de problemas de clústeres

Gestión de Hadoop procesos
Inicio y detención de procesos con scripts de inicio
Inicio y detención de procesos manualmente
Tareas de mantenimiento de HDFS
Adición de un nodo de datos
Retirada de un nodo de datos
Comprobación de la integridad del sistema de archivos con fsck
Equilibrio de datos de bloque HDFS
Lidiar con un disco fallido
Tareasde mantenimiento de MapReduce
Eliminar un trabajo de MapReduce
Eliminar una tarea de MapReduce
Gestión del agotamiento de recursos

Módulo 12. Monitorización

Las métricas disponibles Hadoop
El papel de SNMP
Supervisión del estado
Comprobaciones a nivel de host
Comprobaciones de HDFS
Comprobaciones de MapReduce

Módulo 13. Copia de seguridad y recuperación

Copia de seguridad de datos
Copia distribuida (distcp)
Ingesta de datos en paralelo
Metadatos de nodo de nombre

21 horas

Número de participantes

En línea

Nuestras oficinas

Seleccione el lugar

Seleccione un lugar

Precio por participante

Los cursos de formación abiertos requieren más de 5 participantes.

Cursos de Hadoop para Desarrolladores y Administradores - Booking

Nombre completo *

Teléfono *

Correo electrónico *

Título Profesional

Nombre de la Empresa

Dirección 1 *

Dirección 2

Ciudad *

Estado / Provincia

País *

Código Postal *

Identificación Fiscal

Fecha de Inicio

Fecha final

Las fechas están sujetas a disponibilidad y tienen lugar entre 09:30 y 16:30.

Método de Pago *

Transferencia Bancaria (Factura, OC)

Débito / Tarjeta de Crédito

Información Adicional

Comentarios

Permitir Certificado de Publicación

Si marca esta casilla, los participantes recibirán la opción de publicar su certificado de curso en el Catálogo de profesionales certificados de NobleProg.

Términos y Condiciones *

Soy un representante autorizado del cliente arriba mencionado y deseo reservar los cursos o servicios arriba mencionados de acuerdo con los Términos y Condiciones y la Política de Privacidad de NobleProg.

Informarme sobre descuentos y promociones

Lea nuestra Política de privacidad para saber cómo utilizamos sus datos

Cursos de Hadoop para Desarrolladores y Administradores - CONSULTA

Nombre completo *

Teléfono *

Preferred

Correo electrónico *

Preferred

Nombre de la Empresa

Dirección de la Compañía

Preferred

Número de participantes

Fecha

¿Cómo quiere hacer el curso?

Instalaciones del cliente

En línea

Nuestras oficinas

Nombre del Curso

Duración, horas

Hora adecuada

Idioma preferido

Dirección del lugar sugerido

Comentarios

Informarme sobre descuentos y promociones

Lea nuestra Política de privacidad para saber cómo utilizamos sus datos

Hadoop para Desarrolladores y Administradores - Consultas

Nombre completo *

Teléfono *

Correo electrónico *

Nombre de la Empresa

Asunto de la consulta *

Consulta sobre el Objetivo

Duración de la Consulta

Cantidad de Consultores

Fecha Adecuada

¿Con quién va a trabajar el consultor?

Consulta Urgente *

Nombre del Curso

Duración, horas

Comentarios

Informarme sobre descuentos y promociones

Lea nuestra Política de privacidad para saber cómo utilizamos sus datos

Testimonios (1)

The fact that all the data and software was ready to use on an already prepared VM, provided by the trainer in external disks.

vyzVoice

Curso - Hadoop for Developers and Administrators

Cursos Relacionados

Hortonworks Data Platform (HDP) para Administradores

21 horas

Esta capacitación en vivo dirigida por un instructor en Colombia (en línea o en el sitio) presenta Hortonworks Data Platform (HDP) y guía a los participantes a través de la implementación de la solución Spark + Hadoop.

Al final de esta capacitación, los participantes podrán:

Utilice Hortonworks para ejecutar Hadoop de forma fiable a gran escala. Unifique las capacidades de seguridad, gobernanza y operaciones de Hadoop con los flujos de trabajo analíticos ágiles de Spark. Utilice Hortonworks para investigar, validar, certificar y dar soporte a cada uno de los componentes de un proyecto de Spark. Procese diferentes tipos de datos, incluidos los estructurados, los no estructurados, en movimiento y en reposo.

Apache Ambari: Administre de manera eficiente los clústeres de Hadoop

21 horas

Apache Ambari es una plataforma de administración de código abierto para el aprovisionamiento, la administración, el monitoreo y la seguridad de los clústeres de Apache Hadoop.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán las herramientas y prácticas de administración proporcionadas por Ambari para administrar con éxito los clústeres de Hadoop.

Al final de esta capacitación, los participantes podrán:

Configure un clúster de Big Data en tiempo real usando Ambari

Aplicar las características y funcionalidades avanzadas de Ambari a varios casos de uso
Agregue y elimine nodos sin problemas según sea necesario
Mejore el rendimiento de un clúster de Hadoop a través de ajustes y ajustes

Audiencia

DevOps
Administradores del sistema
DBAs
Profesionales de prueba de Hadoop

Formato del curso

Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Impala para Inteligencia Empresarial

21 horas

Cloudera Impala es un motor de consulta de procesamiento paralelo masivo (MPP) SQL de código abierto para clústeres Apache Hadoop.

Impala permite a los usuarios emitir consultas de baja latencia SQL a los datos almacenados en Hadoop Distributed File System y Apache Hbase sin necesidad de movimiento o transformación de datos.

Audiencia

Este curso está dirigido a analistas y científicos de datos que realizan análisis sobre datos almacenados en Hadoop a través de herramientas de Business Intelligence o SQL.

Después de este curso, los delegados podrán

Extraiga información significativa de los clústeres de Hadoop con Impala.
Escribir programas específicos para facilitar Business Intelligence en Impala SQL Dialecto.
Solucionar problemas de Impala.

Análisis de Datos con Hive / HiveQL

7 horas

Este curso cubre cómo usar el lenguaje Hive SQL (AKA: Hive HQL, SQL en Hive, HiveQL) para personas que extraen datos de Hive

Capacitación de Administrador para Apache Hadoop

35 horas

Audiencia:

El curso está dirigido a especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en un entorno de sistema distribuido

Gol:

Conocimiento profundo sobre administración de clúster de Hadoop.

Big Data Analytics in Health

21 horas

El análisis de Big Data implica el proceso de examinar grandes cantidades de conjuntos de datos variados para descubrir correlaciones, patrones ocultos y otras ideas útiles.

La industria de la salud tiene cantidades masivas de datos clínicos y médicos heterogéneos complejos. La aplicación de análisis de big data en datos de salud presenta un enorme potencial para obtener información para mejorar la prestación de servicios de salud. Sin embargo, la magnitud de estos conjuntos de datos plantea grandes desafíos en los análisis y aplicaciones prácticas en un entorno clínico.

En esta capacitación en vivo (remota) dirigida por un instructor, los participantes aprenderán cómo realizar análisis de big data en salud a medida que realizan una serie de ejercicios prácticos de laboratorio en vivo.

Al final de esta capacitación, los participantes podrán:

Instale y configure herramientas de análisis de big data como Hadoop MapReduce y Spark
Comprender las características de los datos médicos.
Aplicar técnicas de big data para manejar datos médicos.
Estudiar los sistemas y algoritmos de big data en el contexto de las aplicaciones de salud.

Audiencia

Desarrolladores
Científicos de datos

Formato del curso

Conferencia en parte, discusión en parte, ejercicios y práctica práctica.

Nota

Para solicitar una capacitación personalizada para este curso, contáctenos para organizarlo.

Datameer para Analistas de Datos

14 horas

Datameer es una plataforma de inteligencia de negocios y análisis construida en Hadoop. Permite a los usuarios finales acceder, explorar y correlacionar datos a gran escala, estructurados, semiestructurados y no estructurados de una manera fácil de usar.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Datameer para superar la pronunciada curva de aprendizaje de Hadoop a medida que avanzan en la configuración y el análisis de una serie de grandes fuentes de datos.

Al final de esta capacitación, los participantes podrán:

Crea, selecciona e interactivamente explora un lago de datos empresariales
Acceda a almacenes de datos de inteligencia empresarial, bases de datos transaccionales y otras tiendas analíticas
Use una interfaz de usuario de hoja de cálculo para diseñar las tuberías de procesamiento de datos de extremo a extremo
Acceda a funciones preconstruidas para explorar relaciones de datos complejas
Utilice asistentes de arrastrar y soltar para visualizar datos y crear paneles
Use tablas, cuadros, gráficos y mapas para analizar los resultados de las consultas

Audiencia

Analistas de datos

Formato del curso

Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Administración de Hadoop

21 horas

El curso está dedicado a especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en entornos de sistemas distribuidos

Objetivo del curso:

Obtención de conocimientos sobre la administración de clúster de Hadoop

Hadoop para Administradores

21 horas

Apache Hadoop es el marco más popular para procesar Big Data en clústeres de servidores. En este curso de tres (opcionalmente, cuatro) días, los asistentes aprenderán sobre los beneficios empresariales y los casos de uso de Hadoop y su ecosistema, cómo planificar el despliegue y crecimiento del clúster, cómo instalar, mantener, monitorear, solucionar y optimizar Hadoop. También practicarán la carga de datos a granel del clúster, se familiarizarán con varias distribuciones de Hadoop y practicarán la instalación y administración de herramientas del ecosistema de Hadoop. El curso finaliza con la discusión sobre la seguridad del clúster con Kerberos.

"... Los materiales estaban muy bien preparados y cubiertos a fondo. El laboratorio fue muy servicial y bien organizado "
- Andrew Nguyen, Ingeniero Principal de Integración DW, Microsoft Online Advertising

Audiencia
Administradores de Hadoop

Formato
Conferencias y laboratorios prácticos, balance aproximado 60% conferencias, 40% laboratorios.

Hadoop para Desarrolladores (4 días)

28 horas

Apache Hadoop es el marco más popular para procesar Big Data en clústeres de servidores. Este curso presentará un desarrollador a varios componentes (HDFS, MapReduce, Pig, Hive y HBase) Hadoop ecosistema.

Hadoop Avanzado para Desarrolladores

21 horas

Apache Hadoop es uno de los frameworks más populares para procesar Big Data en clusters de servidores. Este curso profundiza en el manejo de datos en HDFS, Pig, Hive y HBase. Estas técnicas avanzadas de programación serán beneficiosas para los desarrolladores experimentados de Hadoop.

Audiencia: desarrolladores

Duración: tres días

Formato: conferencias (50%) y laboratorios prácticos (50%).

Hadoop para jefes de proyecto

14 horas

En esta capacitación dirigida por un instructor en Colombia, los participantes aprenderán los componentes centrales del ecosistema Hadoop y cómo se pueden utilizar estas tecnologías para resolver problemas a gran escala. Al aprender estos fundamentos, los participantes mejorarán su capacidad para comunicarse con los desarrolladores e implementadores de estos sistemas, así como con los científicos y analistas de datos que involucran muchos proyectos de TI.

Audiencia

Gerentes de proyecto que deseen implementar Hadoop en su infraestructura de desarrollo o TI existente
Gerentes de proyectos que necesitan comunicarse con equipos multifuncionales que incluyen ingenieros de big data, científicos de datos y analistas de negocios

Administración de Hadoop en MapR

28 horas

Audiencia:

Este curso pretende desmitificar la tecnología de datos / hadoop y demostrar que no es difícil de entender.

Hadoop con Python

28 horas

Hadoop es un popular marco de procesamiento Big Data. Python es un lenguaje de programación de alto nivel famoso por su claridad de sintaxis y código.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo trabajar con Hadoop, MapReduce, Pig y Spark utilizando Python, ya que pasan por múltiples ejemplos y casos de uso.

Al final de esta capacitación, los participantes podrán:

Comprender los conceptos básicos detrás de Hadoop, MapReduce, Pig y Spark
Utilice Python con Hadoop Distributed File System (HDFS), MapReduce, Pig y Spark
Utilice Snakebite para acceder mediante programación a HDFS dentro de Python
Usa mrjob para escribir trabajos de MapReduce en Python
Escribir programas Spark con Python
Extienda la funcionalidad del cerdo usando las UDF de Python
Administrar trabajos de MapReduce y scripts Pig utilizando Luigi

Audiencia

Desarrolladores
Profesionales de TI

Formato del curso

Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Hadoop and Spark for Administrators

35 horas

Esta capacitación en vivo dirigida por un instructor en Colombia (en línea o en el sitio) está dirigida a administradores de sistemas que desean aprender a configurar, implementar y administrar Hadoop clústeres dentro de su organización.

Al final de esta capacitación, los participantes serán capaces de:

Instale y configure Apache Hadoop.
Comprenda los cuatro componentes principales del ecosistema de Hadoop: HDFS, MapReduce, YARN y Hadoop Common.
Utilice el sistema de archivos distribuido de Hadoop (HDFS) para escalar un clúster a cientos o miles de nodos.
Configure HDFS para que funcione como motor de almacenamiento para implementaciones de Spark locales.
Configure Spark para acceder a soluciones de almacenamiento alternativas como Amazon S3 y sistemas de bases de datos NoSQL como Redis, Elasticsearch, Couchbase, Aerospike, etc.
Llevar a cabo tareas administrativas como el aprovisionamiento, la gestión, la supervisión y la seguridad de un clúster de Apache Hadoop.

Cursos de Hadoop para Desarrolladores y Administradores

Programa del Curso

Módulo 1. Introducción a Hadoop

Módulo 2. Introducción a MapReduce

Módulo 3. Planificación de un clúster Hadoop

Módulo 4. Instalación y configuración

Módulo 5. Descripción Hadoop de E/S

Módulo 6. Desarrollo de una aplicación MapReduce

Módulo 7. Identidad, autenticación y autorización

Módulo 8. Recurso Management

Módulo 9. Tipos y formatos de MapReduce

Módulo 10. Uso de las entidades de MapReduce

Módulo 11. Mantenimiento y solución de problemas de clústeres

Módulo 12. Monitorización

Módulo 13. Copia de seguridad y recuperación

Testimonios (1)

vyzVoice

Curso - Hadoop for Developers and Administrators

Cursos Relacionados

Hortonworks Data Platform (HDP) para Administradores

Apache Ambari: Administre de manera eficiente los clústeres de Hadoop

Audiencia

Formato del curso

Impala para Inteligencia Empresarial

Análisis de Datos con Hive / HiveQL

Capacitación de Administrador para Apache Hadoop

Audiencia:

Gol:

Big Data Analytics in Health

Datameer para Analistas de Datos

Audiencia

Formato del curso

Administración de Hadoop

Objetivo del curso:

Hadoop para Administradores

Hadoop para Desarrolladores (4 días)

Hadoop Avanzado para Desarrolladores

Hadoop para jefes de proyecto

Administración de Hadoop en MapR

Audiencia:

Hadoop con Python

Audiencia

Formato del curso

Hadoop and Spark for Administrators

Categorías Relacionadas

Hadoop

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites