Programa del Curso

Introducción a Apache Spark

  • El papel de Spark en el procesamiento de big data
  • Arquitectura de Spark y sus componentes

Configuración Apache Spark

  • Requisitos de hardware y software
  • Procedimientos de instalación para los modos autónomo y de clúster
  • Prácticas recomendadas de configuración para administradores de sistemas

Administración de clústeres de Spark

  • Herramientas y técnicas de gestión de clústeres
  • Supervisión de aplicaciones de Spark y recursos de clúster
  • Configuraciones de seguridad y gestión de usuarios

Ajuste y optimización del rendimiento

  • Asignación y programación de recursos
  • Tuning Spark para un rendimiento óptimo
  • Identificación y resolución de cuellos de botella comunes

Solución de problemas y resolución de problemas

  • Desafíos comunes de la administración de Spark
  • Herramientas y técnicas de diagnóstico para la resolución de problemas
  • Enfoque paso a paso para resolver problemas comunes
  • Procedimientos recomendados para mantener un entorno de Spark saludable

Temas de Administración Avanzada

  • Integración con otras herramientas de big data
  • Garantizar la alta disponibilidad y la recuperación ante desastres
  • Actualización y escalado de clústeres de Spark

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de configuración y gestión de redes
  • Familiaridad con el sistema operativo Linux y la interfaz de línea de comandos
  • Interés en aprender sobre sistemas de computación distribuida y gestión de big data

Audiencia

  • Administradores de sistemas
 35 horas

Número de participantes



Precio por participante

Testimonios (5)

Cursos Relacionados

Python y Spark para Big Data (PySpark)

21 horas

Introducción a Graph Computing

28 horas

Inteligencia Artificial - La Materia más Aplicada - Análisis de Datos + AI Distribuido + PNL

21 horas

Apache Spark MLlib

35 horas

Big Data Analytics in Health

21 horas

Hadoop and Spark for Administrators

35 horas

Hortonworks Data Platform (HDP) para Administradores

21 horas

Una introducción práctica al procesamiento de flujo

21 horas

Magellan: Análisis Geoespacial con Spark

14 horas

Apache Spark for .NET Developers

21 horas

SMACK Stack for Data Science

14 horas

Apache Spark Fundamentals

21 horas

Apache Spark in the Cloud

21 horas

Spark para Desarrolladores

21 horas

Scaling Data Pipelines with Spark NLP

14 horas

Categorías Relacionadas