Contacta con nosotros

Temario del curso

Arquitectura de Greenplum

  • Procesamiento paralelo y procesamiento simétrico multiprocesador (SMP).
  • Roles de segmentos y configuración del clúster.
  • Escalabilidad y movimiento de datos.
  • Arquitectura del almacén de datos de Greenplum.

Estructuras de tablas en Greenplum

  • Tablas distribuidas frente a tablas asignadas aleatoriamente.
  • Tablas heap frente a tablas de solo agregación (append-only).
  • Formatos de almacenamiento por filas frente a columnas.
  • Tablas particionadas y agrupadas (clustered).

Distribución de datos y funciones hash

  • Lógica de funciones hash y claves de distribución.
  • Manejo de sesgos y su impacto en el rendimiento.
  • Mapas hash y estrategias de colocación de filas.

Índices y optimización del rendimiento

  • Índices agrupados (clustered) y no agrupados.
  • Casos de uso de índices B-tree y bitmap.
  • Comportamiento de escaneo de índices y almacenamiento.

Diseño físico de bases de datos

  • Normalización y diseño del modelo lógico.
  • Estrategias de acceso de usuarios y análisis de distribución.
  • Demografía de datos y decisiones de indexación.

Técnicas de desnormalización

  • Datos derivados, tablas resumen y pre-uniones.
  • Tablas columnares como particionamiento vertical.
  • Data marts y vistas materializadas.

SQL avanzado y ejecución de consultas

  • Estrategias de unión (join) y redistribución.
  • Funciones OLAP y de ventana.
  • Tablas temporales, subconsultas y tablas derivadas.

Planes EXPLAIN y ajuste de consultas

  • Lectura e interpretación de la salida de EXPLAIN.
  • Análisis de costos y optimización de planes.
  • Movimiento de uniones y operaciones locales por segmento.

Utilidades de Greenplum y mejores prácticas

  • ANALYZE y VACUUM.
  • Carga y movimiento de datos con Nexus.
  • Seguridad, permisos y consejos de rendimiento.

Resumen y próximos pasos

Requerimientos

  • Conocimiento de bases de datos relacionales y SQL.
  • Experiencia con sistemas de almacén de datos o analíticos.
  • Familiaridad con operaciones de línea de comandos en Linux.

Público objetivo

  • Arquitectos e ingenieros de datos.
  • Administradores de bases de datos y líderes técnicos.
  • Desarrolladores de BI y especialistas en análisis que trabajen con Greenplum.
 21 Horas

Número de participantes


Precio por participante

Testimonios (5)

Próximos cursos

Categorías Relacionadas