Inicio
Big Data Formación
Hadoop Formación
Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Público objetivo:

Este curso está diseñado para especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en entornos de sistemas distribuidos.

Objetivo:

Adquirir un conocimiento profundo sobre la administración de clústeres Hadoop.

Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Temario del curso

1: HDFS (17%)

Describir la función de los demonios de HDFS.
Describir el funcionamiento normal de un clúster de Apache Hadoop, tanto en el almacenamiento de datos como en el procesamiento de datos.
Identificar las características actuales de los sistemas informáticos que motivan la necesidad de un sistema como Apache Hadoop.
Clasificar los objetivos principales del diseño de HDFS.
Dado un escenario, identificar el caso de uso apropiado para la federación de HDFS.
Identificar los componentes y demonios de un clúster HDFS HA-Quorum.
Analizar el papel de la seguridad de HDFS (Kerberos).
Determinar la mejor opción de serialización de datos para un escenario determinado.
Describir los flujos de lectura y escritura de archivos.
Identificar los comandos para manipular archivos en la consola del sistema de archivos de Hadoop.

2: YARN y MapReduce versión 2 (MRv2) (17%)

Comprender cómo afecta la actualización de un clúster de Hadoop 1 a Hadoop 2 en la configuración del clúster.
Comprender cómo desplegar MapReduce v2 (MRv2 / YARN), incluidos todos los demonios de YARN.
Comprender la estrategia básica de diseño para MapReduce v2 (MRv2).
Determinar cómo YARN gestiona la asignación de recursos.
Identificar el flujo de trabajo de un trabajo MapReduce ejecutándose en YARN.
Determinar qué archivos deben modificarse y cómo para migrar un clúster de MapReduce versión 1 (MRv1) a MapReduce versión 2 (MRv2) ejecutándose en YARN.

3: Planificación de clústeres Hadoop (16%)

Puntos principales a considerar al elegir el hardware y los sistemas operativos para alojar un clúster de Apache Hadoop.
Analizar las opciones al seleccionar un sistema operativo.
Comprender el ajuste del núcleo y el intercambio de disco.
Dado un escenario y un patrón de carga de trabajo, identificar una configuración de hardware adecuada para dicho escenario.
Dado un escenario, determinar los componentes del ecosistema que el clúster necesita ejecutar para cumplir con el acuerdo de nivel de servicio (SLA).
Dimensionamiento del clúster: dada un escenario y la frecuencia de ejecución, identificar los detalles específicos de la carga de trabajo, incluidos CPU, memoria, almacenamiento y E/S de disco.
Dimensionamiento y configuración de discos, incluyendo JBOD frente a RAID, SANs, virtualización y requisitos de dimensionamiento de discos en un clúster.
Topologías de red: comprender el uso de la red en Hadoop (tanto para HDFS como para MapReduce) y proponer o identificar los componentes clave del diseño de red para un escenario determinado.

4: Instalación y administración de clústeres Hadoop (25%)

Dado un escenario, identificar cómo el clúster gestionará las fallas de disco y de máquinas.
Analizar la configuración de registro y el formato de los archivos de configuración de registro.
Comprender los conceptos básicos de las métricas de Hadoop y la supervisión de la salud del clúster.
Identificar la función y el propósito de las herramientas disponibles para la supervisión del clúster.
Poder instalar todos los componentes del ecosistema en CDH 5, incluyendo (pero no limitado a): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive y Pig.
Identificar la función y el propósito de las herramientas disponibles para gestionar el sistema de archivos de Apache Hadoop.

5: Gestión de recursos (10%)

Comprender los objetivos generales de diseño de cada uno de los planificadores de Hadoop.
Dado un escenario, determinar cómo el planificador FIFO asigna los recursos del clúster.
Dado un escenario, determinar cómo el planificador justo (Fair Scheduler) asigna los recursos del clúster bajo YARN.
Dado un escenario, determinar cómo el planificador de capacidad (Capacity Scheduler) asigna los recursos del clúster.

6: Supervisión y registro (15%)

Comprender las funciones y características de las capacidades de recopilación de métricas de Hadoop.
Analizar las interfaces web de NameNode y JobTracker.
Comprender cómo supervisar los demonios del clúster.
Identificar y supervisar el uso de CPU en los nodos maestros.
Describir cómo supervisar el intercambio de memoria y la asignación de memoria en todos los nodos.
Identificar cómo visualizar y gestionar los archivos de registro de Hadoop.
Interpretar un archivo de registro.

Requerimientos

Conocimientos básicos de administración de Linux
Habilidades básicas de programación

35 Horas

Número de participantes

En línea

Presencial

Seleccione el lugar

Seleccione un lugar

Precio por participante

Los cursos públicos requieren más de 5 participantes.

Capacitación de Administrador para Apache Hadoop - Reserva

Nombre completo *

Correo electrónico *

Teléfono *

Título Profesional

Nombre de la Empresa

Dirección 1 *

Ciudad *

Estado / Provincia

País *

Código Postal *

Fecha de Inicio

Identificación Fiscal

Las fechas están sujetas a disponibilidad y tendrán lugar entre 09:30 y 16:30.

Pago *

Transferencia Bancaria (Factura, OC)

Débito / Tarjeta de Crédito

Comentarios

Términos y Condiciones *

Soy un representante autorizado del cliente arriba mencionado y deseo reservar los cursos o servicios arriba mencionados de acuerdo con los Términos y Condiciones y la Política de Privacidad de NobleProg.

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Capacitación de Administrador para Apache Hadoop - Consulta

Nombre completo *

Correo electrónico *

Teléfono *

Número de participantes

Nombre de la Empresa

Dirección de la Compañía

¿Cómo quiere hacer el curso?

Instalaciones del Cliente

En línea

Presencial

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Capacitación de Administrador para Apache Hadoop - Solicitud de consultoría

Nombre completo *

Teléfono *

Correo electrónico *

Nombre de la Empresa

Asunto de la consulta *

Consulta sobre el Objetivo

¿Con quién va a trabajar el consultor?

Consulta Urgente *

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Testimonios (3)

I genuinely enjoyed the many hands-on sessions.

Jacek Pieczatka

Curso - Administrator Training for Apache Hadoop

Traducción Automática

I genuinely enjoyed the big competences of Trainer.

Grzegorz Gorski

Curso - Administrator Training for Apache Hadoop

Traducción Automática

I mostly liked the trainer giving real live Examples.

Simon Hahn

Curso - Administrator Training for Apache Hadoop

Traducción Automática

Próximos cursos

Capacitación de Administrador para Apache Hadoop

2026-06-15 09:30

35 horas

Bogotá - Edificio Salon Monserrate

13612 USD (En línea)

16112 USD (Presencial)

Capacitación de Administrador para Apache Hadoop

2026-06-29 09:30

35 horas

Medellín - San Fernando Plaza

13612 USD (En línea)

16112 USD (Presencial)

Capacitación de Administrador para Apache Hadoop

2026-07-13 09:30

35 horas

Barranquilla, Buro 51

13612 USD (En línea)

16112 USD (Presencial)

Capacitación de Administrador para Apache Hadoop

2026-07-27 09:30

35 horas

Barranquilla - Torres Verdes

13612 USD (En línea)

16112 USD (Presencial)

Cursos Relacionados

Avanzada R

14 Horas

Esta formación impartida por un instructor, en vivo en Colombia (en línea o en sitio), está dirigida a usuarios intermedios de R avanzado que desean utilizar R para desarrollar flujos de trabajo más rápidos, mejorar la calidad del código y gestionar tareas de análisis más complejas.

Al finalizar esta formación, los participantes serán capaces de: crear funciones reutilizables, mejorar los flujos de trabajo con datos, depurar y optimizar el código, y generar informes reproducibles.

Trading algorítmico con Python y R

14 Horas

Esta formación impartida por un instructor en tiempo real en Colombia (en línea o presencial) está dirigida a analistas de negocios que deseen automatizar sus operaciones mediante trading algorítmico, Python y R.

Al finalizar esta formación, los participantes estarán en capacidad de:

Emplear algoritmos para comprar y vender valores en incrementos especializados de manera rápida.
Reducir los costos asociados a las operaciones mediante el uso de trading algorítmico.
Monitorear automáticamente los precios de las acciones y ejecutar operaciones.

Programación con Big Data en R

21 Horas

Big Data es un término que se refiere a soluciones diseñadas para almacenar y procesar grandes conjuntos de datos. Desarrolladas inicialmente por Google, estas soluciones de Big Data han evolucionado e inspirado otros proyectos similares, muchos de los cuales están disponibles como código abierto. R es un lenguaje de programación popular en la industria financiera.

Introducción a R (Básico a Intermedio)

14 Horas

Esta capacitación impartida por un instructor, en vivo en Colombia (en línea o en sitio), está dirigida a analistas de datos de nivel principiante que deseen utilizar la programación en R para manipular datos, realizar análisis de datos básicos y crear visualizaciones convincentes para obtener información valiosa.

Al finalizar esta capacitación, los participantes serán capaces de:

Comprender los fundamentos de la programación en R.
Aplicar procesos fundamentales de ciencia de datos.
Crear representaciones visuales de datos.

Fundamentos de R

21 Horas

R es un lenguaje de programación gratuito y de código abierto diseñado para el cálculo estadístico, el análisis de datos y la creación de gráficos. Cada vez más gerentes y analistas de datos, tanto en el sector corporativo como en el académico, están adoptando R. Además, ha ganado seguidores entre estadísticos, ingenieros y científicos que no tienen experiencia en programación informática, ya que lo encuentran fácil de usar. Su popularidad se debe al creciente uso de la minería de datos para diversos objetivos, como establecer precios de publicidad, descubrir nuevos fármacos con mayor rapidez o ajustar modelos financieros. R cuenta con una amplia variedad de paquetes dedicados a la minería de datos.

Análisis de conglomerados con R y SAS

14 Horas

Esta capacitación presencial, impartida por un instructor en Colombia (en línea o in situ), está dirigida a analistas de datos que deseen programar con R dentro de SAS para realizar análisis de conglomerados.

Al finalizar esta capacitación, los participantes estarán en capacidad de:

Aplicar el análisis de conglomerados en proyectos de minería de datos.
Dominar la sintaxis de R para desarrollar soluciones de agrupamiento.
Implementar métodos de agrupamiento jerárquico y no jerárquico.
Tomar decisiones basadas en datos que contribuyan a mejorar las operaciones empresariales.

Datos y análisis: desde cero

42 Horas

El análisis de datos es una herramienta fundamental en el mundo empresarial actual. A lo largo del curso, nos centraremos en desarrollar habilidades prácticas para el análisis de datos. El objetivo es ayudar a los participantes a ofrecer respuestas basadas en evidencia a preguntas clave:

¿Qué ha ocurrido?

Procesamiento y análisis de datos
Generación de visualizaciones de datos informativas

¿Qué ocurrirá?

Proyección del rendimiento futuro
Evaluación de pronósticos

¿Qué debería ocurrir?

Transformación de datos en decisiones empresariales basadas en evidencia
Optimización de procesos

Análisis de Datos con Python, R, Power Query y Power BI

21 Horas

Esta capacitación presencial o en línea en Colombia, impartida por un instructor, está dirigida a profesionales principiantes que deseen limpiar y analizar datos, realizar proyecciones estadísticas y crear visualizaciones reveladoras utilizando estas herramientas.

Al finalizar esta capacitación, los participantes podrán:

Comprender los fundamentos de Python, R, Power Query y Power BI para el análisis de datos.
Limpieza y organización de conjuntos de datos usando Python y Power Query.
Realizar análisis estadísticos y proyecciones con R.
Crear paneles e informes profesionales con Power BI.
Integrar y analizar datos de múltiples fuentes de manera efectiva.

Análisis de Datos con R

21 Horas

R es un entorno de código abierto muy popular para la computación estadística, el análisis de datos y la creación de gráficos. Este curso introduce a los estudiantes al lenguaje de programación R. Aborda los fundamentos del lenguaje, las bibliotecas y conceptos avanzados. Se exploran técnicas avanzadas de análisis de datos y representación gráfica utilizando datos del mundo real.

Público Objetivo

Desarrolladores y profesionales de análisis de datos

Duración

3 días

Formato

Clases teóricas y sesiones prácticas

Econometría: Eviews y Risk Simulator

21 Horas

Esta capacitación impartida por un instructor, en vivo en Colombia (en línea o en el sitio), está dirigida a cualquier persona que desee aprender y dominar los fundamentos del análisis y la modelación econométrica.

Al finalizar esta capacitación, los participantes podrán:

Aprender y comprender los fundamentos de la econometría.
Utilizar Eviews y simuladores de riesgo.

Pronosticar con R

14 Horas

Esta capacitación impartida por un instructor, en vivo en Colombia (en línea o presencial), está dirigida a analistas de datos de nivel intermedio y profesionales de negocios que deseen realizar pronósticos de series de tiempo y automatizar flujos de trabajo de análisis de datos utilizando R.

Al finalizar esta capacitación, los participantes podrán:

Comprender los fundamentos de las técnicas de pronóstico en R.
Aplicar modelos de suavizado exponencial y ARIMA para el análisis de series de tiempo.
Utilizar el paquete 'forecast' para generar modelos de pronóstico precisos.
Automatizar flujos de trabajo de pronóstico para aplicaciones empresariales e investigativas.

Análisis de RRHH para Organizaciones Públicas

14 Horas

Esta capacitación impartida por un instructor, en vivo (en línea o en sitio), está dirigida a profesionales de recursos humanos que deseen utilizar métodos analíticos para mejorar el desempeño organizacional. Este curso aborda enfoques cualitativos y cuantitativos, empíricos y estadísticos.

Formato del curso

Conferencias interactivas y debates.
Numerosos ejercicios y prácticas.

Opciones de personalización del curso

Para solicitar una capacitación personalizada para este curso, contáctenos para coordinar los detalles.

Pronóstico de Mercado

14 Horas

Público objetivo

Este curso ha sido diseñado para analistas y pronosticadores que deseen introducir o mejorar sus habilidades en pronósticos, ya sea relacionados con la previsión de ventas, el pronóstico económico, la previsión tecnológica, la gestión de la cadena de suministro o la previsión de la demanda y la oferta.

Descripción

Este curso guía a los participantes a través de una serie de metodologías, marcos de trabajo y algoritmos útiles para decidir cómo prever el futuro basándose en datos históricos.

Utiliza herramientas estándar como Microsoft Excel o ciertos programas de código abierto (en especial el proyecto R).

Los principios abordados en este curso pueden implementarse en cualquier software (por ejemplo, SAS, SPSS, Statistica, MINITAB, etc.).

Análisis Estadístico Mediante SPSS

21 Horas

Este entrenamiento presencial, impartido por un instructor en Colombia (en línea o en sitio), está dirigido a profesionales de nivel principiante a intermedio que deseen realizar análisis estadístico con SPSS para interpretar datos con precisión, ejecutar pruebas estadísticas complejas y generar insights significativos.

Al finalizar este entrenamiento, los participantes serán capaces de:

Navegar por la interfaz de SPSS y gestionar conjuntos de datos de manera eficiente.
Realizar análisis estadísticos descriptivos e inferenciales.
Conducir pruebas t, ANOVA, MANOVA, regresión y análisis de correlación.
Aplicar pruebas no paramétricas, análisis de componentes principales y análisis factorial para una interpretación avanzada de los datos.

Introducción a la visualización de datos con Tidyverse y R

7 Horas

Público objetivo

Formato del curso

Al finalizar esta capacitación, los participantes podrán:

En esta capacitación en vivo con instrucción directa, los participantes aprenderán a manipular y visualizar datos utilizando las herramientas incluidas en Tidyverse.

Tidyverse es un conjunto versátil de paquetes de R diseñados para limpiar, procesar, modelar y visualizar datos. Algunos de los paquetes que lo componen son: ggplot2, dplyr, tidyr, readr, purrr y tibble.

Principiantes en el lenguaje R
Principiantes en análisis de datos y visualización de datos

Combinación de exposición teórica, discusión, ejercicios y práctica intensiva de manos a la obra

Realizar análisis de datos y crear visualizaciones atractivas
Extraer conclusiones útiles de diversos conjuntos de datos de muestra
Filtrar, ordenar y resumir datos para responder preguntas exploratorias
Transformar datos procesados en gráficos de líneas, gráficos de barras e histogramas informativos
Importar y filtrar datos desde diversas fuentes, incluyendo archivos de Excel, CSV y SPSS

Capacitación de Administrador para Apache Hadoop

Público objetivo:

Objetivo:

Temario del curso

1: HDFS (17%)

2: YARN y MapReduce versión 2 (MRv2) (17%)

3: Planificación de clústeres Hadoop (16%)

4: Instalación y administración de clústeres Hadoop (25%)

5: Gestión de recursos (10%)

6: Supervisión y registro (15%)

Requerimientos

Testimonios (3)

Jacek Pieczatka

Curso - Administrator Training for Apache Hadoop

Grzegorz Gorski

Curso - Administrator Training for Apache Hadoop

Simon Hahn

Curso - Administrator Training for Apache Hadoop

Próximos cursos

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Capacitación de Administrador para Apache Hadoop

Público objetivo:

Objetivo:

Temario del curso

1: HDFS (17%)

2: YARN y MapReduce versión 2 (MRv2) (17%)

3: Planificación de clústeres Hadoop (16%)

4: Instalación y administración de clústeres Hadoop (25%)

5: Gestión de recursos (10%)

6: Supervisión y registro (15%)

Requerimientos

Testimonios (3)

Jacek Pieczatka

Curso - Administrator Training for Apache Hadoop

Grzegorz Gorski

Curso - Administrator Training for Apache Hadoop

Simon Hahn

Curso - Administrator Training for Apache Hadoop

Próximos cursos

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Capacitación de Administrador para Apache Hadoop

Cursos Relacionados

Avanzada R

Trading algorítmico con Python y R

Programación con Big Data en R

Introducción a R (Básico a Intermedio)

Fundamentos de R

Análisis de conglomerados con R y SAS

Datos y análisis: desde cero

¿Qué ha ocurrido?

¿Qué ocurrirá?

¿Qué debería ocurrir?

Análisis de Datos con Python, R, Power Query y Power BI

Análisis de Datos con R

Público Objetivo

Duración

Formato

Econometría: Eviews y Risk Simulator

Pronosticar con R

Análisis de RRHH para Organizaciones Públicas

Pronóstico de Mercado

Público objetivo

Descripción

Análisis Estadístico Mediante SPSS

Introducción a la visualización de datos con Tidyverse y R

Categorías Relacionadas

Hadoop

Estadísticas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites