Temario del curso
Introducción
Comprensión del Big Data
Visión general de Spark
Visión general de Python
Visión general de PySpark
- Distribución de datos utilizando el marco Resilient Distributed Datasets
- Distribución de cálculos utilizando los operadores de la API de Spark
Configuración de Python con Spark
Configuración de PySpark
Uso de instancias EC2 de Amazon Web Services (AWS) para Spark
Configuración de Databricks
Configuración del clúster AWS EMR
Aprendizaje de los fundamentos de la programación en Python
- Primeros pasos con Python
- Uso de Jupyter Notebook
- Uso de variables y tipos de datos simples
- Trabajo con listas
- Uso de instrucciones if
- Uso de entradas de usuario
- Trabajo con bucles while
- Implementación de funciones
- Trabajo con clases
- Trabajo con archivos y excepciones
- Trabajo con proyectos, datos y APIs
Aprendizaje de los fundamentos de Spark DataFrame
- Primeros pasos con Spark DataFrames
- Implementación de operaciones básicas con Spark
- Uso de operaciones Groupby y agregación
- Trabajo con marcas de tiempo y fechas
Trabajo en un ejercicio de proyecto con Spark DataFrame
Comprensión del aprendizaje automático con MLlib
Trabajo con MLlib, Spark y Python para aprendizaje automático
Comprensión de las regresiones
- Aprendizaje de la teoría de la regresión lineal
- Implementación de un código de evaluación de regresión
- Trabajo en un ejercicio de ejemplo de regresión lineal
- Aprendizaje de la teoría de la regresión logística
- Implementación de un código de regresión logística
- Trabajo en un ejercicio de ejemplo de regresión logística
Comprensión de los bosques aleatorios y los árboles de decisión
- Aprendizaje de la teoría de los métodos de árboles
- Implementación de códigos de árboles de decisión y bosques aleatorios
- Trabajo en un ejercicio de ejemplo de clasificación con bosques aleatorios
Trabajo con agrupación K-means
- Comprensión de la teoría de la agrupación K-means
- Implementación de un código de agrupación K-means
- Trabajo en un ejercicio de ejemplo de agrupación
Trabajo con sistemas de recomendación
Implementación del procesamiento del lenguaje natural
- Comprensión del procesamiento del lenguaje natural (PLN)
- Visión general de las herramientas de PLN
- Trabajo en un ejercicio de ejemplo de PLN
Transmisión con Spark en Python
- Visión general de la transmisión con Spark
- Ejercicio de ejemplo de transmisión con Spark
Comentarios de cierre
Requerimientos
- Conocimientos generales de programación
Público objetivo
- Desarrolladores
- Profesionales de TI
- Científicos de datos
Testimonios (6)
Me gustó que fuera práctico. Amé aplicar el conocimiento teórico con ejemplos prácticos.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
El curso trataba sobre una serie de temas muy complejos y relacionados, y Pablo tiene un conocimiento profundo de cada uno de ellos. A veces, los matices se perdían en la comunicación y/o debido a las presiones de tiempo, lo que posiblemente hizo que las expectativas no se cumplieran del todo por esta razón. También hubo algunos problemas con la configuración de UHG/Azure Databricks, pero Pablo/UHG resolvió estos rápidamente una vez que se hicieron evidentes. Esto para mí demostró un alto nivel de entendimiento y profesionalismo entre UHG y Pablo,
Michael Monks - Tech NorthWest Skillnet
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
Atención individualizada.
ARCHANA ANILKUMAR - PPL
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
Formación práctica..
Abraham Thomas - PPL
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
Las lecciones se impartieron en un cuaderno de Jupyter. Los temas estaban estructurados con una secuencia lógica y ayudaron naturalmente a desarrollar la sesión desde las partes más sencillas hasta las más complejas. Ya soy un usuario avanzado de Python con conocimientos en Aprendizaje Automático, por lo que encontré el curso más fácil de seguir que, posiblemente, algunos de mis compañeros que tomaron el curso de formación. Aprecio que se hayan omitido algunos de los conceptos más elementales y que se haya centrado en los temas más sustanciales.
Angela DeLaMora - ADT, LLC
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
tareas de práctica
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática