Temario del curso

Arquitectura de Greenplum

  • Procesamiento en paralelo y procesamiento simétrico multiproceso (SMP)
  • Roles de segmentos y configuración del clúster
  • Escalabilidad y movimiento de datos
  • Arquitectura de Greenplum Data Warehouse

Estructuras de Tablas en Greenplum

  • Tablas distribuidas vs. tablas asignadas aleatoriamente
  • Tablas heap vs. tablas de solo apéndice (append-only)
  • Formatos de almacenamiento por filas y columnas (row vs. columnar)
  • Tablas particionadas y agrupadas

Distribución de Datos y Hashing

  • Lógica de hashing y claves de distribución
  • Manejo del sesgo (skew) y su impacto en el rendimiento
  • Mapas hash y estrategias de colocación de filas

Índices y Optimización del Rendimiento

  • Índices agrupados y no agrupados (clustered vs. non-clustered)
  • Casos de uso para índices B-tree y bitmap
  • Escaneo de índices y comportamiento de almacenamiento

Diseño Físico de la Base de Datos

  • Normalización y diseño del modelo lógico
  • Estrategias de acceso de usuarios y análisis de distribución
  • Demografía de datos y decisiones de indexación

Técnicas de Desnormalización

  • Datos derivados, tablas resumen y preuniones (pre-joins)
  • Tablas columnares como particionamiento vertical
  • Data marts y vistas materializadas

SQL Avanzado y Ejecución de Consultas

  • Estrategias de unión (join) y redistribución
  • OLAP y funciones de ventana (window functions)
  • Tablas temporales, subconsultas y tablas derivadas

Planes EXPLAIN y Ajuste de Consultas

  • Lectura e interpretación de la salida EXPLAIN
  • Análisis de costos y optimización del plan
  • Movimiento de uniones y operaciones locales en segmentos (segment-local)

Utilidades y Mejores Prácticas de Greenplum

  • ANALYZE y VACUUM
  • Carga y movimiento de datos con Nexus
  • Seguridad, permisos y consejos de rendimiento

Resumen y Próximos Pasos

Requerimientos

  • Conocimiento de bases de datos relacionales y SQL
  • Experiencia con sistemas de data warehousing o analíticos
  • Familiaridad con operaciones en la línea de comandos de Linux

Público objetivo

  • Arquitectos y ingenieros de datos
  • Administradores de bases de datos y líderes técnicos
  • Desarrolladores de BI y especialistas en análisis que trabajan con Greenplum
 21 Horas

Número de participantes


Precio por participante

Testimonios (5)

Próximos cursos

Categorías Relacionadas


Fatal error: Uncaught TypeError: _isl_get_excluded_site(): Return value must be of type ?array, none returned in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc:38 Stack trace: #0 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(30): _isl_get_excluded_site() #1 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(17): isl_get_excluded_site() #2 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(51): get_outline_isls() #3 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(7): islc_prepare_links() #4 /apps/hitra7/npfrontend/nptemplates/default.php(272): islc7_sites_links_array_v3() #5 /apps/hitra7/npfrontend/modules/course/course.php(143): require_once('...') #6 /apps/hitra7/npfrontend/core/routes.php(15): course_menu_callback() #7 /apps/hitra7/npfrontend/__index.php(81): require_once('...') #8 /apps/hitra7/npfrontend/index.php(15): include_once('...') #9 /apps/hitra7/index.php(66): include_once('...') #10 {main} thrown in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc on line 38