Temario del curso
Introducción
- Visión general de las características y arquitectura de Spark y Hadoop
- Comprensión del big data
- Conceptos básicos de programación en Python
Primeros pasos
- Configuración de Python, Spark y Hadoop
- Comprensión de las estructuras de datos en Python
- Comprensión de la API de PySpark
- Comprensión de HDFS y MapReduce
Integración de Spark y Hadoop con Python
- Implementación de Spark RDD en Python
- Procesamiento de datos utilizando MapReduce
- Creación de conjuntos de datos distribuidos en HDFS
Aprendizaje automático con Spark MLlib
Procesamiento de big data con Spark Streaming
Trabajo con sistemas de recomendación
Trabajo con Kafka, Sqoop, Kafka y Flume
Apache Mahout con Spark y Hadoop
Resolución de problemas
Resumen y próximos pasos
Requerimientos
- Experiencia con Spark y Hadoop
- Experiencia en programación con Python
Público objetivo
- Científicos de datos
- Desarrolladores
Testimonios (3)
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
Me gustó que logró sentar las bases del tema y llegar a algunos ejercicios bastante avanzados. También proporcionó formas sencillas de escribir y probar el código.
Ionut Goga - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática