Temario del curso
Introducción
- Apache Spark frente a Hadoop MapReduce
Visión general de las características y arquitectura de Apache Spark
Elección del lenguaje de programación
Configuración de Apache Spark
Creación de una aplicación de ejemplo
Selección del conjunto de datos
Ejecución de análisis de datos en los datos
Procesamiento de datos estructurados con Spark SQL
Procesamiento de datos en flujo con Spark Streaming
Integración de Apache Spark con herramientas de aprendizaje automático de terceros
Uso de Apache Spark para procesamiento de grafos
Optimización de Apache Spark
Resolución de problemas
Resumen y conclusiones
Requerimientos
- Experiencia con la línea de comandos de Linux
- Conocimientos generales sobre procesamiento de datos
- Experiencia en programación con Java, Scala, Python o R
Público objetivo
- Desarrolladores
Testimonios (3)
Me gustó que fuera práctico. Amé aplicar el conocimiento teórico con ejemplos prácticos.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
La combinación de teoría y práctica con herramientas como databricks