Inicio
cursos big data
cursos hadoop

Cursos de Administración de Hadoop en MapR

(1 Testimonios)

Audiencia:

Este curso pretende desmitificar la tecnología de datos / hadoop y demostrar que no es difícil de entender.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Programa del Curso

Descripción general de Big Data:

¿Qué es Big Data
Por qué Big Data está ganando popularidad
Big Data Estudios de caso
Big Data Características
Soluciones a trabajar Big Data.

Hadoop y sus componentes:

Qué es Hadoop y cuáles son sus componentes.
Hadoop Arquitectura y sus características de los datos que puede manejar /Process.
Resumen sobre Hadoop Historia, empresas que lo utilizan y por qué han empezado a utilizarlo.
Hadoop Marco y sus componentes: explicados en detalle.
¿Qué es HDFS y lee -Escribe en Hadoop Sistema de archivos distribuido.
Cómo configurar Hadoop el clúster en diferentes modos: clúster independiente/pseudo/multinodo.

(Esto incluye la configuración de un clúster de Hadoop en VirtualBox/KVM/VMware, las configuraciones de red que deben examinarse cuidadosamente, la ejecución de los demonios de Hadoop y la prueba del clúster).

¿Qué es el marco de trabajo de Map Reduce y cómo funciona?
Ejecución de trabajos de Map Reduce en el clúster Hadoop.
Descripción de la replicación, la duplicación y el reconocimiento de bastidores en el contexto de Hadoop clústeres.

Hadoop Planificación de clústeres:

Cómo planear el clúster de Hadoop.
Comprensión del hardware y el software para planificar el clúster de Hadoop.
Comprender las cargas de trabajo y planificar el clúster para evitar errores y un rendimiento óptimo.

¿Qué es MapR y por qué MapR?

Descripción general de MapR y su arquitectura.
Comprensión y funcionamiento del sistema de control MapR, volúmenes MapR, instantáneas y espejos.
Planificación de un clúster en el contexto de MapR.
Comparación de MapR con otras distribuciones y Apache Hadoop.
Instalación de MapR y despliegue de clústeres.

Configuración y administración de clústeres:

Gestión de servicios, nodos, instantáneas, volúmenes espejo y clústeres remotos.
Comprensión y gestión de nodos.
Comprensión de Hadoop componentes, Instalación de Hadoop componentes junto con MapR Services.
Acceso a los datos en el clúster, incluso a través de NFS, administración de servicios y nodos.
Gestión de datos mediante el uso de volúmenes, gestión de usuarios y grupos, gestión y asignación de roles a los nodos, puesta en marcha, desmantelamiento de nodos, administración de clústeres y supervisión del rendimiento, configuración/análisis y supervisión de métricas para supervisar el rendimiento, configuración y administración de la seguridad de MapR.
Comprender y trabajar con M7: almacenamiento nativo para tablas MapR.
Configuración y ajuste del clúster para un rendimiento óptimo.

Actualización del clúster e integración con otras configuraciones:

Actualización de la versión de software de MapR y tipos de actualización.
Configuración del clúster de Mapr para acceder al clúster de HDFS.
Configuración del clúster de MapR en Amazon Elastic Mapreduce.

Todos los temas anteriores incluyen demostraciones y sesiones de práctica para que los alumnos tengan experiencia práctica con la tecnología.

Requerimientos

Conocimientos básicos de Linux FS
Java básico
Conocimientos de Apache Hadoop (recomendado)

28 horas

Número de participantes

En línea

Nuestras oficinas

Seleccione el lugar

Seleccione un lugar

Precio por participante

Los cursos de formación abiertos requieren más de 5 participantes.

Cursos de Administración de Hadoop en MapR - Booking

Nombre completo *

Teléfono *

Correo electrónico *

Título Profesional

Nombre de la Empresa

Dirección 1 *

Dirección 2

Ciudad *

Estado / Provincia

País *

Código Postal *

Identificación Fiscal

Fecha de Inicio

Fecha final

Las fechas están sujetas a disponibilidad y tienen lugar entre 09:30 y 16:30.

Método de Pago *

Transferencia Bancaria (Factura, OC)

Débito / Tarjeta de Crédito

Información Adicional

Comentarios

Permitir Certificado de Publicación

Si marca esta casilla, los participantes recibirán la opción de publicar su certificado de curso en el Catálogo de profesionales certificados de NobleProg.

Términos y Condiciones *

Soy un representante autorizado del cliente arriba mencionado y deseo reservar los cursos o servicios arriba mencionados de acuerdo con los Términos y Condiciones y la Política de Privacidad de NobleProg.

Informarme sobre descuentos y promociones

Lea nuestra Política de privacidad para saber cómo utilizamos sus datos

Cursos de Administración de Hadoop en MapR - CONSULTA

Nombre completo *

Teléfono *

Preferred

Correo electrónico *

Preferred

Nombre de la Empresa

Dirección de la Compañía

Preferred

Número de participantes

Fecha

¿Cómo quiere hacer el curso?

Instalaciones del cliente

En línea

Nuestras oficinas

Nombre del Curso

Duración, horas

Hora adecuada

Idioma preferido

Dirección del lugar sugerido

Comentarios

Informarme sobre descuentos y promociones

Lea nuestra Política de privacidad para saber cómo utilizamos sus datos

Administración de Hadoop en MapR - Consultas

Nombre completo *

Teléfono *

Correo electrónico *

Nombre de la Empresa

Asunto de la consulta *

Consulta sobre el Objetivo

Duración de la Consulta

Cantidad de Consultores

Fecha Adecuada

¿Con quién va a trabajar el consultor?

Consulta Urgente *

Nombre del Curso

Duración, horas

Comentarios

Informarme sobre descuentos y promociones

Lea nuestra Política de privacidad para saber cómo utilizamos sus datos

Testimonios (1)

practical things of doing, also theory was served good by Ajay

Dominik Mazur - Capgemini Polska Sp. z o.o.

Curso - Hadoop Administration on MapR

Cursos Relacionados

Hortonworks Data Platform (HDP) para Administradores

21 horas

Esta capacitación en vivo dirigida por un instructor en Colombia (en línea o en el sitio) presenta Hortonworks Data Platform (HDP) y guía a los participantes a través de la implementación de la solución Spark + Hadoop.

Al final de esta capacitación, los participantes podrán:

Utilice Hortonworks para ejecutar Hadoop de forma fiable a gran escala. Unifique las capacidades de seguridad, gobernanza y operaciones de Hadoop con los flujos de trabajo analíticos ágiles de Spark. Utilice Hortonworks para investigar, validar, certificar y dar soporte a cada uno de los componentes de un proyecto de Spark. Procese diferentes tipos de datos, incluidos los estructurados, los no estructurados, en movimiento y en reposo.

Apache Ambari: Administre de manera eficiente los clústeres de Hadoop

21 horas

Apache Ambari es una plataforma de administración de código abierto para el aprovisionamiento, la administración, el monitoreo y la seguridad de los clústeres de Apache Hadoop.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán las herramientas y prácticas de administración proporcionadas por Ambari para administrar con éxito los clústeres de Hadoop.

Al final de esta capacitación, los participantes podrán:

Configure un clúster de Big Data en tiempo real usando Ambari

Aplicar las características y funcionalidades avanzadas de Ambari a varios casos de uso
Agregue y elimine nodos sin problemas según sea necesario
Mejore el rendimiento de un clúster de Hadoop a través de ajustes y ajustes

Audiencia

DevOps
Administradores del sistema
DBAs
Profesionales de prueba de Hadoop

Formato del curso

Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Impala para Inteligencia Empresarial

21 horas

Cloudera Impala es un motor de consulta de procesamiento paralelo masivo (MPP) SQL de código abierto para clústeres Apache Hadoop.

Impala permite a los usuarios emitir consultas de baja latencia SQL a los datos almacenados en Hadoop Distributed File System y Apache Hbase sin necesidad de movimiento o transformación de datos.

Audiencia

Este curso está dirigido a analistas y científicos de datos que realizan análisis sobre datos almacenados en Hadoop a través de herramientas de Business Intelligence o SQL.

Después de este curso, los delegados podrán

Extraiga información significativa de los clústeres de Hadoop con Impala.
Escribir programas específicos para facilitar Business Intelligence en Impala SQL Dialecto.
Solucionar problemas de Impala.

Análisis de Datos con Hive / HiveQL

7 horas

Este curso cubre cómo usar el lenguaje Hive SQL (AKA: Hive HQL, SQL en Hive, HiveQL) para personas que extraen datos de Hive

Capacitación de Administrador para Apache Hadoop

35 horas

Audiencia:

El curso está dirigido a especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en un entorno de sistema distribuido

Gol:

Conocimiento profundo sobre administración de clúster de Hadoop.

Big Data Analytics in Health

21 horas

El análisis de Big Data implica el proceso de examinar grandes cantidades de conjuntos de datos variados para descubrir correlaciones, patrones ocultos y otras ideas útiles.

La industria de la salud tiene cantidades masivas de datos clínicos y médicos heterogéneos complejos. La aplicación de análisis de big data en datos de salud presenta un enorme potencial para obtener información para mejorar la prestación de servicios de salud. Sin embargo, la magnitud de estos conjuntos de datos plantea grandes desafíos en los análisis y aplicaciones prácticas en un entorno clínico.

En esta capacitación en vivo (remota) dirigida por un instructor, los participantes aprenderán cómo realizar análisis de big data en salud a medida que realizan una serie de ejercicios prácticos de laboratorio en vivo.

Al final de esta capacitación, los participantes podrán:

Instale y configure herramientas de análisis de big data como Hadoop MapReduce y Spark
Comprender las características de los datos médicos.
Aplicar técnicas de big data para manejar datos médicos.
Estudiar los sistemas y algoritmos de big data en el contexto de las aplicaciones de salud.

Audiencia

Desarrolladores
Científicos de datos

Formato del curso

Conferencia en parte, discusión en parte, ejercicios y práctica práctica.

Nota

Para solicitar una capacitación personalizada para este curso, contáctenos para organizarlo.

Datameer para Analistas de Datos

14 horas

Datameer es una plataforma de inteligencia de negocios y análisis construida en Hadoop. Permite a los usuarios finales acceder, explorar y correlacionar datos a gran escala, estructurados, semiestructurados y no estructurados de una manera fácil de usar.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Datameer para superar la pronunciada curva de aprendizaje de Hadoop a medida que avanzan en la configuración y el análisis de una serie de grandes fuentes de datos.

Al final de esta capacitación, los participantes podrán:

Crea, selecciona e interactivamente explora un lago de datos empresariales
Acceda a almacenes de datos de inteligencia empresarial, bases de datos transaccionales y otras tiendas analíticas
Use una interfaz de usuario de hoja de cálculo para diseñar las tuberías de procesamiento de datos de extremo a extremo
Acceda a funciones preconstruidas para explorar relaciones de datos complejas
Utilice asistentes de arrastrar y soltar para visualizar datos y crear paneles
Use tablas, cuadros, gráficos y mapas para analizar los resultados de las consultas

Audiencia

Analistas de datos

Formato del curso

Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Administración de Hadoop

21 horas

El curso está dedicado a especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en entornos de sistemas distribuidos

Objetivo del curso:

Obtención de conocimientos sobre la administración de clúster de Hadoop

Hadoop para Administradores

21 horas

Apache Hadoop es el marco más popular para procesar Big Data en clústeres de servidores. En este curso de tres (opcionalmente, cuatro) días, los asistentes aprenderán sobre los beneficios empresariales y los casos de uso de Hadoop y su ecosistema, cómo planificar el despliegue y crecimiento del clúster, cómo instalar, mantener, monitorear, solucionar y optimizar Hadoop. También practicarán la carga de datos a granel del clúster, se familiarizarán con varias distribuciones de Hadoop y practicarán la instalación y administración de herramientas del ecosistema de Hadoop. El curso finaliza con la discusión sobre la seguridad del clúster con Kerberos.

"... Los materiales estaban muy bien preparados y cubiertos a fondo. El laboratorio fue muy servicial y bien organizado "
- Andrew Nguyen, Ingeniero Principal de Integración DW, Microsoft Online Advertising

Audiencia
Administradores de Hadoop

Formato
Conferencias y laboratorios prácticos, balance aproximado 60% conferencias, 40% laboratorios.

Hadoop para Desarrolladores (4 días)

28 horas

Apache Hadoop es el marco más popular para procesar Big Data en clústeres de servidores. Este curso presentará un desarrollador a varios componentes (HDFS, MapReduce, Pig, Hive y HBase) Hadoop ecosistema.

Hadoop Avanzado para Desarrolladores

21 horas

Apache Hadoop es uno de los frameworks más populares para procesar Big Data en clusters de servidores. Este curso profundiza en el manejo de datos en HDFS, Pig, Hive y HBase. Estas técnicas avanzadas de programación serán beneficiosas para los desarrolladores experimentados de Hadoop.

Audiencia: desarrolladores

Duración: tres días

Formato: conferencias (50%) y laboratorios prácticos (50%).

Hadoop para Desarrolladores y Administradores

21 horas

Hadoop es el marco de procesamiento de Big Data más popular .

Hadoop para jefes de proyecto

14 horas

En esta capacitación dirigida por un instructor en Colombia, los participantes aprenderán los componentes centrales del ecosistema Hadoop y cómo se pueden utilizar estas tecnologías para resolver problemas a gran escala. Al aprender estos fundamentos, los participantes mejorarán su capacidad para comunicarse con los desarrolladores e implementadores de estos sistemas, así como con los científicos y analistas de datos que involucran muchos proyectos de TI.

Audiencia

Gerentes de proyecto que deseen implementar Hadoop en su infraestructura de desarrollo o TI existente
Gerentes de proyectos que necesitan comunicarse con equipos multifuncionales que incluyen ingenieros de big data, científicos de datos y analistas de negocios

Hadoop con Python

28 horas

Hadoop es un popular marco de procesamiento Big Data. Python es un lenguaje de programación de alto nivel famoso por su claridad de sintaxis y código.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo trabajar con Hadoop, MapReduce, Pig y Spark utilizando Python, ya que pasan por múltiples ejemplos y casos de uso.

Al final de esta capacitación, los participantes podrán:

Comprender los conceptos básicos detrás de Hadoop, MapReduce, Pig y Spark
Utilice Python con Hadoop Distributed File System (HDFS), MapReduce, Pig y Spark
Utilice Snakebite para acceder mediante programación a HDFS dentro de Python
Usa mrjob para escribir trabajos de MapReduce en Python
Escribir programas Spark con Python
Extienda la funcionalidad del cerdo usando las UDF de Python
Administrar trabajos de MapReduce y scripts Pig utilizando Luigi

Audiencia

Desarrolladores
Profesionales de TI

Formato del curso

Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Hadoop and Spark for Administrators

35 horas

Esta capacitación en vivo dirigida por un instructor en Colombia (en línea o en el sitio) está dirigida a administradores de sistemas que desean aprender a configurar, implementar y administrar Hadoop clústeres dentro de su organización.

Al final de esta capacitación, los participantes serán capaces de:

Instale y configure Apache Hadoop.
Comprenda los cuatro componentes principales del ecosistema de Hadoop: HDFS, MapReduce, YARN y Hadoop Common.
Utilice el sistema de archivos distribuido de Hadoop (HDFS) para escalar un clúster a cientos o miles de nodos.
Configure HDFS para que funcione como motor de almacenamiento para implementaciones de Spark locales.
Configure Spark para acceder a soluciones de almacenamiento alternativas como Amazon S3 y sistemas de bases de datos NoSQL como Redis, Elasticsearch, Couchbase, Aerospike, etc.
Llevar a cabo tareas administrativas como el aprovisionamiento, la gestión, la supervisión y la seguridad de un clúster de Apache Hadoop.

Cursos de Administración de Hadoop en MapR

Audiencia:

Programa del Curso

Descripción general de Big Data:

Hadoop y sus componentes:

Hadoop Planificación de clústeres:

¿Qué es MapR y por qué MapR?

Configuración y administración de clústeres:

Actualización del clúster e integración con otras configuraciones:

Requerimientos

Testimonios (1)

Dominik Mazur - Capgemini Polska Sp. z o.o.

Curso - Hadoop Administration on MapR

Cursos Relacionados

Hortonworks Data Platform (HDP) para Administradores

Apache Ambari: Administre de manera eficiente los clústeres de Hadoop

Impala para Inteligencia Empresarial

Análisis de Datos con Hive / HiveQL

Capacitación de Administrador para Apache Hadoop

Big Data Analytics in Health

Datameer para Analistas de Datos

Administración de Hadoop

Hadoop para Administradores

Hadoop para Desarrolladores (4 días)

Hadoop Avanzado para Desarrolladores

Hadoop para Desarrolladores y Administradores

Hadoop para jefes de proyecto

Hadoop con Python

Hadoop and Spark for Administrators

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites