Contacta con nosotros

Temario del curso

Introducción

  • Visión general de las características y arquitectura de Spark y Hadoop
  • Comprensión del big data
  • Conceptos básicos de programación en Python

Primeros pasos

  • Configuración de Python, Spark y Hadoop
  • Comprensión de las estructuras de datos en Python
  • Comprensión de la API de PySpark
  • Comprensión de HDFS y MapReduce

Integración de Spark y Hadoop con Python

  • Implementación de Spark RDD en Python
  • Procesamiento de datos utilizando MapReduce
  • Creación de conjuntos de datos distribuidos en HDFS

Aprendizaje automático con Spark MLlib

Procesamiento de big data con Spark Streaming

Trabajo con sistemas de recomendación

Trabajo con Kafka, Sqoop, Kafka y Flume

Apache Mahout con Spark y Hadoop

Resolución de problemas

Resumen y próximos pasos

Requerimientos

  • Experiencia con Spark y Hadoop
  • Experiencia en programación con Python

Público objetivo

  • Científicos de datos
  • Desarrolladores
 21 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas