Contacta con nosotros

Temario del curso

Fundamentos de la Administración de Kafka

  • El lugar de Kafka en una plataforma de datos moderna y las responsabilidades típicas de producción
  • Conceptos fundamentales para operadores: brokers, temas, particiones, offsets y grupos de consumidores
  • Fundamentos de la replicación: líderes y seguidores, réplicas en sincronía (ISR) y compensaciones de disponibilidad
  • Aspectos operativos clave de Kafka y la terminología común utilizada en libros de procedimientos (runbooks)

Modo KRaft y Diseño del Clúster

  • Conceptos básicos de KRaft: controladores, cuórum de metadatos, elecciones y su importancia operativa
  • Planificación del despliegue: dimensionamiento para rendimiento, particiones, retención y crecimiento
  • Roles y distribuciones de nodos: controladores combinados vs. dedicados, consideraciones de dominio de fallos
  • Laboratorio: inspeccionar metadatos de KRaft, validar la salud del cuórum e interpretar los registros de los controladores

Instalación, Configuración y Operaciones Diarias

  • Enfoques de instalación (paquetes, tarball, contenedores) y qué estandarizar en entornos empresariales
  • Configuración central del broker que impacta la confiabilidad: listeners, replicación, directorios de registros y retención
  • Operaciones seguras del servicio: orden de inicio, cierre ordenado y verificaciones de validación
  • Laboratorio: desplegar un clúster de múltiples nodos, verificar el registro de los brokers y confirmar la producción y consumo básicos

Gestión de Temas, Particiones y Ubicación de Datos

  • Ciclo de vida de los temas utilizando la CLI de Kafka: crear, describir, actualizar configuraciones y eliminar
  • Elección de particiones y factores de replicación para cargas de trabajo reales, incluyendo anti-patrones comunes
  • Reasignaciones y balanceo: cuándo mover particiones y cómo verificar el progreso de forma segura
  • Laboratorio: crear temas, desencadenar una reasignación de particiones, simular una caída de broker y confirmar la recuperación

Aseguramiento de Kafka para Producción

  • TLS para tráfico de clientes y entre brokers: certificados, cadenas de confianza y pasos de validación
  • Autenticación con SASL: selección de mecanismos comunes y evitación de configuraciones erróneas
  • Autorización con ACLs: patrones de mínimo privilegio para administradores, productores y consumidores
  • Laboratorio: habilitar TLS y SASL, validar la conectividad de clientes y aplicar ACLs para roles de aplicaciones

Observabilidad, Confiabilidad y Solución de Problemas

  • Esenciales de monitoreo: salud del controlador, particiones sub-replicadas, latencia de solicitudes, saturación de disco y red
  • Registros y métricas: lectura de registros de brokers y exposición de métricas mediante el exportador JMX a pilas de observabilidad comunes
  • Libros de procedimientos operativos: reinicios en rodillo, cambios seguros de configuración, manejo de discos llenos y problemas de ISR
  • Laboratorio: construir un conjunto mínimo de alertas, diagnosticar un clúster degradado y restaurar la replicación saludable

Actualizaciones y Preparación para Recuperación ante Desastres

  • Planificación de actualizaciones para Kafka: verificaciones de compatibilidad, etapas de preparación y enfoque de reversión
  • Expectativas de copias de seguridad y recuperación: qué se puede respaldar, qué no, y fundamentos de recuperación de configuración
  • Descripción general de la replicación entre clústeres y cuándo utilizar MirrorMaker 2 para recuperación ante desastres y migraciones
  • Cierre: lista de verificación operativa, documentos de transferencia y próximos pasos para el despliegue en producción

Requerimientos

  • Comprensión de los conceptos básicos de administración de Linux (usuarios, servicios, archivos, permisos)
  • Experiencia con conceptos de redes TCP/IP (DNS, puertos, firewalls, equilibradores de carga)
  • Experiencia básica en scripting (Bash, PowerShell o similar) para tareas operativas rutinarias

Público Objetivo

  • Administradores de Kafka e ingenieros de plataforma responsables de operar clústeres de Kafka
  • Ingenieros de confiabilidad de sitios (SRE) e ingenieros de DevOps que apoyan plataformas de streaming
  • Equipos de infraestructura y operaciones que despliegan nuevos clústeres de Kafka basados en KRaft o migran desde ZooKeeper
 21 Horas

Número de participantes


Precio por participante

Testimonios (5)

Próximos cursos

Categorías Relacionadas