Contacta con nosotros

Temario del curso

Introducción

  • Visión general de Databricks y Apache Spark
  • Comprensión de la arquitectura de Databricks

Primeros pasos

  • Configuración del entorno
  • Instalación y configuración de Databricks
  • Navegación por la interfaz de usuario de Databricks
  • Creación de un espacio de trabajo en Databricks

Trabajo con datos en Databricks

  • Conexión a una fuente de datos de Apache Spark
  • Comprensión de las columnas y tipos de datos básicos
  • Gestión del sistema de archivos en cuadernos (Notebooks)

Gestión de trabajos y clústeres

  • Creación y configuración de clústeres
  • Creación de trabajos utilizando cuadernos (Notebooks)
  • Ejecución de trabajos
  • Visualización de trabajos y detalles de los mismos

Uso de Delta Lake en Databricks

  • Carga de datos en Delta Lake
  • Gestión de datos en Delta Lake

Seguridad en Databricks

  • Gestión de la seguridad de Databricks
  • Gestión de copias de seguridad y recuperación

Resolución de problemas

Resumen y próximos pasos

Requerimientos

  • Conocimiento básico de análisis de datos
  • Conocimiento de Apache Spark

Público objetivo

  • Ingenieros de datos
  • Científicos de datos
  • Desarrolladores
 14 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas