Programa del Curso

Descripción general de Big Data:

  • ¿Qué es Big Data
  • Por qué Big Data está ganando popularidad
  • Big Data Estudios de caso
  • Big Data Características
  • Soluciones a trabajar Big Data.

Hadoop y sus componentes:

  • Qué es Hadoop y cuáles son sus componentes.
  • Hadoop Arquitectura y sus características de los datos que puede manejar /Process.
  • Resumen sobre Hadoop Historia, empresas que lo utilizan y por qué han empezado a utilizarlo.
  • Hadoop Marco y sus componentes: explicados en detalle.
  • ¿Qué es HDFS y lee -Escribe en Hadoop Sistema de archivos distribuido.
  • Cómo configurar Hadoop el clúster en diferentes modos: clúster independiente/pseudo/multinodo.

(Esto incluye la configuración de un clúster de Hadoop en VirtualBox/KVM/VMware, las configuraciones de red que deben examinarse cuidadosamente, la ejecución de los demonios de Hadoop y la prueba del clúster).

  • ¿Qué es el marco de trabajo de Map Reduce y cómo funciona?
  • Ejecución de trabajos de Map Reduce en el clúster Hadoop.
  • Descripción de la replicación, la duplicación y el reconocimiento de bastidores en el contexto de Hadoop clústeres.

Hadoop Planificación de clústeres:

  • Cómo planear el clúster de Hadoop.
  • Comprensión del hardware y el software para planificar el clúster de Hadoop.
  • Comprender las cargas de trabajo y planificar el clúster para evitar errores y un rendimiento óptimo.

¿Qué es MapR y por qué MapR?

  • Descripción general de MapR y su arquitectura.
  • Comprensión y funcionamiento del sistema de control MapR, volúmenes MapR, instantáneas y espejos.
  • Planificación de un clúster en el contexto de MapR.
  • Comparación de MapR con otras distribuciones y Apache Hadoop.
  • Instalación de MapR y despliegue de clústeres.

Configuración y administración de clústeres:

  • Gestión de servicios, nodos, instantáneas, volúmenes espejo y clústeres remotos.
  • Comprensión y gestión de nodos.
  • Comprensión de Hadoop componentes, Instalación de Hadoop componentes junto con MapR Services.
  • Acceso a los datos en el clúster, incluso a través de NFS, administración de servicios y nodos.
  • Gestión de datos mediante el uso de volúmenes, gestión de usuarios y grupos, gestión y asignación de roles a los nodos, puesta en marcha, desmantelamiento de nodos, administración de clústeres y supervisión del rendimiento, configuración/análisis y supervisión de métricas para supervisar el rendimiento, configuración y administración de la seguridad de MapR.
  • Comprender y trabajar con M7: almacenamiento nativo para tablas MapR.
  • Configuración y ajuste del clúster para un rendimiento óptimo.

Actualización del clúster e integración con otras configuraciones:

  • Actualización de la versión de software de MapR y tipos de actualización.
  • Configuración del clúster de Mapr para acceder al clúster de HDFS.
  • Configuración del clúster de MapR en Amazon Elastic Mapreduce.

Todos los temas anteriores incluyen demostraciones y sesiones de práctica para que los alumnos tengan experiencia práctica con la tecnología.

Requerimientos

  • Conocimientos básicos de Linux FS
  • Java básico
  • Conocimientos de Apache Hadoop (recomendado)
 28 horas

Número de participantes



Precio por participante

Testimonios (1)

Cursos Relacionados

Hortonworks Data Platform (HDP) para Administradores

21 horas

Apache Ambari: Administre de manera eficiente los clústeres de Hadoop

21 horas

Impala para Inteligencia Empresarial

21 horas

Análisis de Datos con Hive / HiveQL

7 horas

Capacitación de Administrador para Apache Hadoop

35 horas

Big Data Analytics in Health

21 horas

Datameer para Analistas de Datos

14 horas

Administración de Hadoop

21 horas

Hadoop para Administradores

21 horas

Hadoop para Desarrolladores (4 días)

28 horas

Hadoop Avanzado para Desarrolladores

21 horas

Hadoop para Desarrolladores y Administradores

21 horas

Hadoop para jefes de proyecto

14 horas

Hadoop con Python

28 horas

Hadoop and Spark for Administrators

35 horas

Categorías Relacionadas