Programa del Curso

Introducción

  • Información general sobre las características y la arquitectura de Spark y Hadoop
  • Comprensión del big data
  • Python Conceptos básicos de programación

Empezar

  • Configuración de Python, Spark y Hadoop
  • Comprensión de las estructuras de datos en Python
  • Descripción de la API de PySpark
  • Descripción de HDFS y MapReduce

Integración de Spark y Hadoop con Python

  • Implementación de Spark RDD en Python
  • Procesamiento de datos con MapReduce
  • Creación de conjuntos de datos distribuidos en HDFS

Machine Learning con Spark MLlib

Procesamiento de Big Data con Spark Streaming

Trabajar con sistemas de recomendación

Trabajar con Kafka, Sqoop, Kafka y Flume

Apache Mahout con Spark y Hadoop

Solución de problemas

Resumen y próximos pasos

Requerimientos

  • Experiencia con Spark y Hadoop
  • Python Experiencia en programación

Audiencia

  • Científicos de datos
  • Desarrolladores
 21 horas

Número de participantes



Precio por participante

Testimonios (2)

Cursos Relacionados

Python y Spark para Big Data (PySpark)

21 horas

Introducción a Graph Computing

28 horas

Inteligencia Artificial - La Materia más Aplicada - Análisis de Datos + AI Distribuido + PNL

21 horas

Apache Spark MLlib

35 horas

Análisis de Datos en Python Usando Pandas y Numpy

14 horas

Accelerating Python Pandas Workflows with Modin

14 horas

Machine Learning with Python and Pandas

14 horas

Scaling Data Analysis with Python and Dask

14 horas

FARM (FastAPI, React, and MongoDB) Full Stack Development

14 horas

Developing APIs with Python and FastAPI

14 horas

Scientific Computing with Python SciPy

7 horas

Game Development with PyGame

7 horas

Desarrollo de Aplicaciones Web con Flask

14 horas

Advanced Flask

14 horas

Build REST APIs with Python and Flask

14 horas

Categorías Relacionadas