Programa del Curso

Avanzada Análisis con Spark

Big Data en la Nube

Estudios de Caso y Mejores Prácticas

Procesamiento de Datos con Apache Spark

Introducción a Google Colab y Apache Spark

Optimización de Flujos de Trabajo de Big Data

Resumen y Próximos Pasos

Visualización y Collaboration en Google Colab

  • Integración de Colab con bibliotecas de visualización populares
  • Flujos de trabajo colaborativos con cuadernos de Colab
  • Compartir y exportar resultados
  • Integración de Google Colab con herramientas basadas en la nube
  • Uso del almacenamiento en la nube para grandes volúmenes de datos
  • Trabajo con Spark en entornos distribuidos en la nube
  • Aprendizaje automático con Spark MLlib
  • Realización de análisis de datos en tiempo real
  • Computación distribuida con Spark
  • Visión general de Google Colab
  • Introducción a Apache Spark
  • Configuración de Spark en Google Colab
  • Revisión de aplicaciones de grandes volúmenes de datos en el mundo real
  • Estudios de casos utilizando Apache Spark y Colab
  • Mejores prácticas para el análisis de grandes volúmenes de datos
  • Afinar Spark para rendimiento
  • Optimización del uso de memoria y almacenamiento
  • Escalado de flujos de trabajo para conjuntos de datos grandes
  • Trabajo con RDDs y DataFrames
  • Carga y procesamiento de grandes conjuntos de datos
  • Uso de Spark SQL para consultar datos estructurados

Requerimientos

Público Objetivo

  • Conocimientos básicos de conceptos de ciencia de datos
  • Familiaridad con Apache Spark
  • Habilidades de programación en Python
  • Científicos de datos
  • Ingenieros de datos
  • Investigadores que trabajan con grandes volúmenes de datos
 14 Horas

Número de participantes


Precio por Participante​

Testimonios (5)

Próximos cursos

Categorías Relacionadas