Programa del Curso

Introducción

  • Apache Arrow vs Parquet

Instalación y configuración Apache Arrow

Descripción general de Apache Arrow Características y arquitectura

Exploración de datos con Pandas y Apache Arrow

Exploración de datos con Spark y Apache Arrow

Exploración de datos con R y Apache Arrow

Exploración de datos con MapD y Apache Arrow

Otras Data Analysis Integraciones

  • PySpark, archivos Parquet en S3, tablas de Oracle e índices de Elasticsearch

Solución de problemas

Resumen y conclusión

Requerimientos

  • Un trasfondo básico de SQL
  • Familiaridad con Python o R
  • Cierta familiaridad con Apache Spark
  14 horas
 

Número de participantes


Comienza

Termina


Las fechas están sujetas a disponibilidad y tienen lugar entre 09:30 y 16:30.
Los cursos de formación abiertos requieren más de 5 participantes.

Testimonios (3)

Cursos Relacionados

Categorías Relacionadas