Contacta con nosotros

Temario del curso

Introducción a Apache Iceberg

  • Panorama general de Apache Iceberg
  • Repaso de conceptos básicos

Análisis profundo de la arquitectura de Iceberg

  • Análisis detallado del formato de tabla de Iceberg
  • Descripción arquitectónica detallada, incluyendo metadatos y disposición de archivos
  • Aspectos internos de la evolución de esquemas y particiones

Instalación y configuración avanzada

  • Configuración de Iceberg para rendimiento óptimo en diferentes entornos
  • Integración con diversos motores de procesamiento de datos
  • Configuración avanzada: seguridad, cifrado y controles de acceso
  • Implementación de Iceberg en un entorno distribuido

Operaciones y mantenimiento avanzados

  • Gestión de tablas Iceberg a gran escala
  • Implementación y gestión de cambios complejos en el esquema
  • Manejo de la evolución de particiones y particionamiento oculto
  • Operaciones CRUD avanzadas con cambios en el esquema y particiones

Técnicas de optimización de consultas

  • Técnicas para reducir la latencia de consultas
  • Recorte de particiones y recorte de archivos
  • Estrategias de caché y optimización de metadatos
  • Implementación y prueba de técnicas de optimización de consultas

Ajuste de rendimiento para conjuntos de datos grandes

  • Optimización del rendimiento para conjuntos de datos a gran escala
  • Uso de las funciones integradas de Iceberg para el ajuste de rendimiento
  • Casos de estudio sobre ajuste de rendimiento en escenarios reales
  • Ajuste de rendimiento para conjuntos de datos a gran escala

Migración e integración avanzada de datos

  • Migración de estructuras de datos complejas desde otros sistemas
  • Integración de Iceberg con flujos de datos en tiempo real
  • Migración de conjuntos de datos complejos e integración de flujos de datos en tiempo real

Confiabilidad y consistencia

  • Garantía de consistencia e integridad de datos en entornos distribuidos
  • Implementación y gestión de compromisos transaccionales
  • Manejo de fallos y mecanismos de recuperación
  • Implementación de funciones de confiabilidad y consistencia

Funciones avanzadas y personalización

  • Implementaciones personalizadas de catálogo
  • Extensión de Iceberg con funciones personalizadas
  • Implementación de catálogos personalizados y ampliación de las funcionalidades de Iceberg

Gobernanza y cumplimiento de datos

  • Implementación de políticas de gobernanza de datos
  • Cumplimiento de normativas de datos
  • Gestión de trazas de auditoría y linaje de datos
  • Implementación de funciones de gobernanza y cumplimiento

Resumen y próximos pasos

Requerimientos

  • Conocimiento de los conceptos fundamentales, operaciones básicas y gestión de tablas Iceberg

Público objetivo

  • Ingenieros de datos
  • Arquitectos de datos
  • Analistas de datos
  • Desarrolladores de software
 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas