Inicio
Big Data Formación
Hadoop Formación
Administración de Hadoop en MapR

Administración de Hadoop en MapR

Público objetivo:

Este curso tiene como objetivo desmitificar la tecnología de big data y Hadoop, demostrando que su comprensión no es difícil.

Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Temario del curso

Panorama general de Big Data:

¿Qué es Big Data?
¿Por qué Big Data está ganando popularidad?
Casos de estudio de Big Data
Características de Big Data
Soluciones para trabajar con Big Data.

Hadoop y sus componentes:

¿Qué es Hadoop y cuáles son sus componentes?
Arquitectura de Hadoop y las características de los datos que puede manejar o procesar.
Breve historia de Hadoop, las empresas que lo utilizan y por qué han comenzado a adoptarlo.
Marco de trabajo de Hadoop y sus componentes: explicación detallada.
¿Qué es HDFS y cómo funcionan las operaciones de lectura y escritura en el Sistema de Archivos Distribuido de Hadoop?
Cómo configurar un clúster de Hadoop en diferentes modos: clúster independiente, pseudo o multi-nodo.

(Esto incluye la configuración de un clúster de Hadoop en VirtualBox, KVM o VMware; la configuración de red que debe revisarse cuidadosamente; el inicio de los demonios de Hadoop y la prueba del clúster).

¿Qué es el marco de trabajo MapReduce y cómo funciona?
Ejecución de trabajos de MapReduce en un clúster de Hadoop.
Comprensión de la replicación, el espejo y la conciencia de rack en el contexto de los clústeres de Hadoop.

Planificación del clúster de Hadoop:

Cómo planificar su clúster de Hadoop.
Comprensión del hardware y software necesarios para planificar su clúster de Hadoop.
Análisis de las cargas de trabajo y planificación del clúster para evitar fallos y garantizar un rendimiento óptimo.

¿Qué es MapR y por qué elegir MapR?:

Panorama general de MapR y su arquitectura.
Comprensión y funcionamiento del Sistema de Control de MapR, los volúmenes de MapR, las instantáneas y los espejos.
Planificación de un clúster en el contexto de MapR.
Comparación de MapR con otras distribuciones y con Apache Hadoop.
Instalación de MapR y despliegue del clúster.

Configuración y administración del clúster:

Gestión de servicios, nodos, instantáneas, volúmenes espejo y clústeres remotos.
Comprensión y administración de nodos.
Comprensión de los componentes de Hadoop e instalación de estos componentes junto con los servicios de MapR.
Acceso a los datos en el clúster, incluido mediante NFS; gestión de servicios y nodos.
Gestión de datos mediante volúmenes, administración de usuarios y grupos, asignación de roles a nodos, activación y desactivación de nodos, administración del clúster y monitoreo del rendimiento; configuración, análisis y monitoreo de métricas para evaluar el rendimiento; configuración y administración de la seguridad de MapR.
Comprensión y trabajo con M7, el almacenamiento nativo para tablas de MapR.
Configuración y ajuste del clúster para lograr un rendimiento óptimo.

Actualización del clúster e integración con otras configuraciones:

Actualización de la versión de software de MapR y tipos de actualización.
Configuración del clúster de MapR para acceder a un clúster de HDFS.
Configuración de un clúster de MapR en Amazon Elastic Mapreduce.

Todos los temas anteriores incluyen demostraciones y sesiones prácticas para que los participantes obtengan experiencia práctica con la tecnología.

Requerimientos

Conocimientos básicos del sistema de archivos de Linux
Conocimientos básicos de Java
Conocimiento de Apache Hadoop (recomendado)

28 Horas

Número de participantes

En línea

Presencial

Seleccione el lugar

Seleccione un lugar

Precio por participante

Los cursos públicos requieren más de 5 participantes.

Administración de Hadoop en MapR - Reserva

Nombre completo *

Correo electrónico *

Teléfono *

Título Profesional

Nombre de la Empresa

Dirección 1 *

Ciudad *

Estado / Provincia

País *

Código Postal *

Fecha de Inicio

Identificación Fiscal

Las fechas están sujetas a disponibilidad y tendrán lugar entre 09:30 y 16:30.

Pago *

Transferencia Bancaria (Factura, OC)

Débito / Tarjeta de Crédito

Comentarios

Términos y Condiciones *

Soy un representante autorizado del cliente arriba mencionado y deseo reservar los cursos o servicios arriba mencionados de acuerdo con los Términos y Condiciones y la Política de Privacidad de NobleProg.

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Administración de Hadoop en MapR - Consulta

Nombre completo *

Correo electrónico *

Teléfono *

Número de participantes

Nombre de la Empresa

Dirección de la Compañía

¿Cómo quiere hacer el curso?

Instalaciones del Cliente

En línea

Presencial

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Administración de Hadoop en MapR - Solicitud de consultoría

Nombre completo *

Teléfono *

Correo electrónico *

Nombre de la Empresa

Asunto de la consulta *

Consulta sobre el Objetivo

¿Con quién va a trabajar el consultor?

Consulta Urgente *

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Testimonios (1)

aspectos prácticos de hacerlo, y también la teoría fue bien explicada por Ajay

Dominik Mazur - Capgemini Polska Sp. z o.o.

Curso - Hadoop Administration on MapR

11275 USD (En línea)

13275 USD (Presencial)

Cursos Relacionados

Capacitación de Administrador para Apache Hadoop

35 Horas

Público objetivo:

Este curso está diseñado para especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en entornos de sistemas distribuidos.

Objetivo:

Adquirir un conocimiento profundo sobre la administración de clústeres Hadoop.

Análisis de Big Data en Salud

21 Horas

El análisis de big data consiste en examinar grandes volúmenes de conjuntos de datos diversos para descubrir correlaciones, patrones ocultos y otras ideas útiles.

La industria de la salud cuenta con cantidades masivas de datos médicos y clínicos complejos y heterogéneos. Aplicar análisis de big data a datos de salud ofrece un gran potencial para obtener información que mejore la prestación de servicios de atención médica. Sin embargo, la magnitud de estos conjuntos de datos presenta grandes desafíos para el análisis y su aplicación práctica en entornos clínicos.

En esta capacitación en vivo, impartida por un instructor (a distancia), los participantes aprenderán a realizar análisis de big data en el ámbito de la salud mientras trabajan en una serie de ejercicios prácticos en laboratorios en vivo.

Al finalizar esta capacitación, los participantes serán capaces de:

Instalar y configurar herramientas de análisis de big data, como Hadoop MapReduce y Spark.
Comprender las características de los datos médicos.
Aplicar técnicas de big data para manejar datos médicos.
Estudiar sistemas y algoritmos de big data en el contexto de aplicaciones de salud.

Público objetivo

Desarrolladores.
Científicos de datos.

Formato del curso

Parte de clase magistral, parte de discusión, ejercicios y práctica intensiva.

Nota

Para solicitar una capacitación personalizada para este curso, por favor contáctenos para coordinar.

Hadoop para Administradores

21 Horas

Apache Hadoop es el framework más popular para procesar Big Data en clústeres de servidores. En este curso de tres días (opcionalmente cuatro), los participantes aprenderán sobre los beneficios empresariales y los casos de uso de Hadoop y su ecosistema, cómo planificar el despliegue y el crecimiento del clúster, así como cómo instalar, mantener, monitorear, solucionar problemas y optimizar Hadoop. Además, practicarán la carga masiva de datos en el clúster, se familiarizarán con diversas distribuciones de Hadoop y ejercitarán la instalación y gestión de herramientas del ecosistema. El curso finalizará con un debate sobre la seguridad del clúster mediante Kerberos.

"…El material estaba muy bien preparado y cubría todos los temas de forma exhaustiva. El laboratorio fue muy útil y estaba muy bien organizado"
— Andrew Nguyen, Ingeniero Principal de Integración DW, Microsoft Online Advertising

Público objetivo

Administradores de Hadoop

Formato

Clases teóricas y laboratorios prácticos, con una distribución aproximada del 60% de teoría y el 40% de práctica.

Hadoop para Desarrolladores (4 días)

28 Horas

Apache Hadoop es el framework más popular para procesar Big Data en clústeres de servidores. Este curso introducirá a un desarrollador a diversos componentes (HDFS, MapReduce, Pig, Hive y HBase) del ecosistema Hadoop.

Hadoop Avanzado para Desarrolladores

21 Horas

Apache Hadoop es uno de los marcos de trabajo más populares para procesar Big Data en clústeres de servidores. Este curso profundiza en la gestión de datos en HDFS, así como en Pig, Hive y HBase avanzados. Estas técnicas de programación avanzada serán beneficiosas para desarrolladores de Hadoop con experiencia.

Público objetivo: desarrolladores

Duración: tres días

Formato: clases magistrales (50%) y laboratorios prácticos (50%).

Hadoop y Spark para administradores

35 Horas

Esta capacitación impartida por un instructor, en vivo en Colombia (en línea o presencial), está dirigida a administradores de sistemas que desean aprender a configurar, implementar y gestionar clústeres de Hadoop dentro de su organización.

Al finalizar esta capacitación, los participantes podrán:

Instalar y configurar Apache Hadoop.
Comprender los cuatro componentes principales del ecosistema de Hadoop: HDFS, MapReduce, YARN y Hadoop Common.
Utilizar el Sistema de Archivos Distribuido de Hadoop (HDFS) para escalar un clúster a cientos o miles de nodos.
Configurar HDFS para que funcione como motor de almacenamiento en implementaciones locales de Spark.
Configurar Spark para acceder a soluciones de almacenamiento alternativas, como Amazon S3 y sistemas de bases de datos NoSQL como Redis, Elasticsearch, Couchbase, Aerospike, entre otros.
Realizar tareas administrativas como el aprovisionamiento, gestión, monitoreo y seguridad de un clúster de Apache Hadoop.

HBase para Desarrolladores

21 Horas

Este curso introduce HBase, una base de datos NoSQL construida sobre Hadoop. Está diseñado para desarrolladores que utilizarán HBase en el desarrollo de aplicaciones y para administradores encargados de gestionar clústeres de HBase.

Guiaremos a los desarrolladores a través de la arquitectura de HBase, el modelado de datos y el desarrollo de aplicaciones sobre HBase. También se abordará el uso de MapReduce con HBase, así como temas de administración relacionados con la optimización del rendimiento. El curso es altamente práctico, con numerosas sesiones de laboratorio.

Duración: 3 días

Público objetivo: Desarrolladores y administradores

Apache NiFi para administradores

21 Horas

Apache NiFi es una plataforma de código abierto para la integración de datos basada en flujos y el procesamiento de eventos. Permite el enrutamiento, la transformación y la mediación de datos en tiempo real entre sistemas dispares, automatizados, con una interfaz web y un control detallado.

Esta formación presencial o remota, impartida por un instructor, está dirigida a administradores e ingenieros de nivel intermedio que deseen desplegar, gestionar, asegurar y optimizar flujos de datos de NiFi en entornos de producción.

Al finalizar esta formación, los participantes podrán:

Instalar, configurar y mantener clústeres de Apache NiFi.
Diseñar y gestionar flujos de datos provenientes de diversas fuentes y destinos.
Implementar lógica de automatización, enrutamiento y transformación de flujos.
Optimizar el rendimiento, monitorear operaciones y solucionar problemas.

Formato del Curso

Clases interactivas con discusión de arquitecturas del mundo real.
Prácticas guiadas: construcción, despliegue y gestión de flujos.
Ejercicios basados en escenarios en un entorno de laboratorio en vivo.

Opciones de Personalización del Curso

Para solicitar una capacitación personalizada para este curso, por favor contáctenos para coordinarlo.

Apache NiFi para desarrolladores

7 Horas

En esta capacitación presencial impartida por un instructor en Colombia, los participantes aprenderán los fundamentos de la programación basada en flujos mientras desarrollan diversas extensiones, componentes y procesadores de demostración utilizando Apache NiFi.

Al finalizar esta capacitación, los participantes podrán:

Comprender la arquitectura de NiFi y los conceptos de flujo de datos.
Desarrollar extensiones utilizando NiFi y APIs de terceros.
Desarrollar de forma personalizada su propio procesador de Apache NiFi.
Ingresar y procesar datos en tiempo real provenientes de formatos de archivo y fuentes de datos diversos e inusuales.

Python, Spark y Hadoop para Big Data

21 Horas

Esta formación presencial, impartida por un instructor en Colombia (en línea o in situ), está dirigida a desarrolladores que deseen utilizar e integrar Spark, Hadoop y Python para procesar, analizar y transformar conjuntos de datos grandes y complejos.

Al finalizar esta formación, los participantes serán capaces de:

Configurar el entorno necesario para comenzar a procesar big data con Spark, Hadoop y Python.
Comprender las características, componentes centrales y arquitectura de Spark y Hadoop.
Aprender a integrar Spark, Hadoop y Python para el procesamiento de big data.
Explorar las herramientas del ecosistema de Spark (Spark MLlib, Spark Streaming, Kafka, Sqoop, Kafka y Flume).
Construir sistemas de recomendación basados en filtrado colaborativo similares a los de Netflix, YouTube, Amazon, Spotify y Google.
Utilizar Apache Mahout para escalar algoritmos de aprendizaje automático.

Administración de Hadoop en MapR

Público objetivo:

Temario del curso

Panorama general de Big Data:

Hadoop y sus componentes:

Planificación del clúster de Hadoop:

¿Qué es MapR y por qué elegir MapR?:

Configuración y administración del clúster:

Actualización del clúster e integración con otras configuraciones:

Requerimientos

Testimonios (1)

Dominik Mazur - Capgemini Polska Sp. z o.o.

Curso - Hadoop Administration on MapR

Próximos cursos

Administración de Hadoop en MapR

Administración de Hadoop en MapR

Administración de Hadoop en MapR

Administración de Hadoop en MapR

Administración de Hadoop en MapR

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites