Temario del curso
Introducción a Apache Spark
- El rol de Spark en el procesamiento de big data
- Arquitectura de Spark y sus componentes
Configuración de Apache Spark
- Requisitos de hardware y software
- Procedimientos de instalación para modos independiente y en clúster
- Mejores prácticas de configuración para administradores de sistemas
Administración de clústeres de Spark
- Herramientas y técnicas de gestión de clústeres
- Monitoreo de aplicaciones de Spark y recursos del clúster
- Configuraciones de seguridad y gestión de usuarios
Ajuste y optimización del rendimiento
- Asignación de recursos y programación
- Ajuste de Spark para un rendimiento óptimo
- Identificación y resolución de cuellos de botella comunes
Solución de problemas y resolución de incidencias
- Desafíos comunes en la administración de Spark
- Herramientas y técnicas de diagnóstico para la solución de problemas
- Enfoque paso a paso para resolver problemas comunes
- Mejores prácticas para mantener un entorno de Spark saludable
Tópicos avanzados de administración
- Integración con otras herramientas de big data
- Garantía de alta disponibilidad y recuperación ante desastres
- Actualización y escalado de clústeres de Spark
Resumen y próximos pasos
Requerimientos
- Conocimientos básicos de configuración y administración de redes
- Familiaridad con el sistema operativo Linux y la interfaz de línea de comandos
- Interés en aprender sobre sistemas de computación distribuida y gestión de big data
Público objetivo
- Administradores de sistemas
Testimonios (3)
Me gustó que fuera práctico. Amé aplicar el conocimiento teórico con ejemplos prácticos.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
La combinación de teoría y práctica con herramientas como databricks