Temario del curso
Arquitectura de Greenplum
- Procesamiento paralelo y procesamiento simétrico multiprocesador (SMP).
- Roles de segmentos y configuración del clúster.
- Escalabilidad y movimiento de datos.
- Arquitectura del almacén de datos de Greenplum.
Estructuras de tablas en Greenplum
- Tablas distribuidas frente a tablas asignadas aleatoriamente.
- Tablas heap frente a tablas de solo agregación (append-only).
- Formatos de almacenamiento por filas frente a columnas.
- Tablas particionadas y agrupadas (clustered).
Distribución de datos y funciones hash
- Lógica de funciones hash y claves de distribución.
- Manejo de sesgos y su impacto en el rendimiento.
- Mapas hash y estrategias de colocación de filas.
Índices y optimización del rendimiento
- Índices agrupados (clustered) y no agrupados.
- Casos de uso de índices B-tree y bitmap.
- Comportamiento de escaneo de índices y almacenamiento.
Diseño físico de bases de datos
- Normalización y diseño del modelo lógico.
- Estrategias de acceso de usuarios y análisis de distribución.
- Demografía de datos y decisiones de indexación.
Técnicas de desnormalización
- Datos derivados, tablas resumen y pre-uniones.
- Tablas columnares como particionamiento vertical.
- Data marts y vistas materializadas.
SQL avanzado y ejecución de consultas
- Estrategias de unión (join) y redistribución.
- Funciones OLAP y de ventana.
- Tablas temporales, subconsultas y tablas derivadas.
Planes EXPLAIN y ajuste de consultas
- Lectura e interpretación de la salida de EXPLAIN.
- Análisis de costos y optimización de planes.
- Movimiento de uniones y operaciones locales por segmento.
Utilidades de Greenplum y mejores prácticas
- ANALYZE y VACUUM.
- Carga y movimiento de datos con Nexus.
- Seguridad, permisos y consejos de rendimiento.
Resumen y próximos pasos
Requerimientos
- Conocimiento de bases de datos relacionales y SQL.
- Experiencia con sistemas de almacén de datos o analíticos.
- Familiaridad con operaciones de línea de comandos en Linux.
Público objetivo
- Arquitectos e ingenieros de datos.
- Administradores de bases de datos y líderes técnicos.
- Desarrolladores de BI y especialistas en análisis que trabajen con Greenplum.
Testimonios (5)
los ejercicios y la resolucion de problemas
Mario Humberto Serrano Gutierrez - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
La teoria fue lo mas interesante
Luis Antonio Jimenez Gil - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
los ejercicios practicos y la disposicion para contestar las preguntas
Edith Vichua Solis - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
la explicacion, creo que uso terminos quee para todos fue demasiado entendible
Moises Jafet Hernandez Fuentes - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
las prácticas
Liliana Padilla - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
Traducción Automática