Creación de aplicaciones de procesamiento de flujo con Kafka Streams
Kafka Streams es una biblioteca del lado del cliente para construir aplicaciones y microservicios cuyos datos se envían y reciben a través de un sistema de mensajería Kafka. Tradicionalmente, Apache Kafka ha dependido de Apache Spark o Apache Storm para procesar datos entre los productores y consumidores de mensajes. Al llamar a la API de Kafka Streams desde dentro de una aplicación, los datos pueden procesarse directamente dentro de Kafka, eliminando la necesidad de enviarlos a un clúster separado para su procesamiento.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a integrar Kafka Streams en un conjunto de aplicaciones de Java de muestra que envían y reciben datos de Apache Kafka para el procesamiento de streams.
Al finalizar esta capacitación, los participantes podrán:
- Comprender las características y ventajas de Kafka Streams frente a otros marcos de procesamiento de streams
- Procesar datos de stream directamente dentro de un clúster de Kafka
- Desarrollar una aplicación o microservicio en Java o Scala que se integre con Kafka y Kafka Streams
- Escrebir código conciso que transforme temas de entrada de Kafka en temas de salida de Kafka
- Construir, empaquetar e implementar la aplicación
Público objetivo
- Desarrolladores
Formato del curso
- Combinación de exposición teórica, discusión, ejercicios y práctica intensiva guiada
Notas
- Para solicitar una capacitación personalizada para este curso, contáctenos para coordinar los detalles.
Temario del curso
Introducción
- Kafka frente a Spark, Flink y Storm
Visión general de las características de Kafka Streams
- Procesamiento con y sin estado, procesamiento basado en tiempo del evento, DSL, operaciones de ventana basadas en tiempo del evento, entre otros.
Estudio de caso: API de Kafka Streams para presupuestación predictiva
Configuración del entorno de desarrollo
Creación de una aplicación de Streams
Inicio del clúster de Kafka
Preparación de los temas y datos de entrada
Opciones para procesar datos de stream
- DSL de alto nivel de Kafka Streams
- Procesador de nivel inferior
Transformación de los datos de entrada
Inspección de los datos de salida
Detener el clúster de Kafka
Opciones para implementar la aplicación
- Herramientas clásicas de operaciones (Puppet, Chef y Salt)
- Docker
- Archivo WAR
Resolución de problemas
Resumen y conclusiones
Requerimientos
- Conocimiento de Apache Kafka
- Experiencia en programación en Java
Los cursos públicos requieren más de 5 participantes.
Creación de aplicaciones de procesamiento de flujo con Kafka Streams - Reserva
Creación de aplicaciones de procesamiento de flujo con Kafka Streams - Consulta
Creación de aplicaciones de procesamiento de flujo con Kafka Streams - Solicitud de consultoría
Testimonios (2)
Las explicaciones eran muy buenas, si bien algunas preguntas pudieron ahorrarse si se hubieran tocado esos puntos al inicio de los temas se notó un buen dominio y experiencia en el tema.
Alan Jaime Rodriguez Garcia - BANCO DE MEXICO
Curso - Stream Processing with Kafka Streams
Recordando/revisando los puntos clave de los temas discutidos.
Paolo Angelo Gaton - SMS Global Technologies Inc.
Curso - Building Stream Processing Applications with Kafka Streams
Traducción Automática
Próximos cursos
Cursos Relacionados
Administración de Confluent Apache Kafka
21 HorasConfluent Apache Kafka es una plataforma distribuida de streaming de eventos diseñada para pipelines de datos de alto rendimiento, tolerantes a fallos y análisis en tiempo real.
Esta capacitación impartida por un instructor, en vivo (en línea o presencial), está dirigida a administradores de sistemas y profesionales de DevOps de nivel intermedio que deseen instalar, configurar, monitorear y solucionar problemas en clústeres de Confluent Apache Kafka.
Al finalizar esta capacitación, los participantes estarán en capacidad de:
- Comprender los componentes y la arquitectura de Confluent Kafka.
- Implementar y gestionar brokers de Kafka, quórum de Zookeeper y servicios clave.
- Configurar funciones avanzadas como seguridad, replicación y ajuste de rendimiento.
- Utilizar herramientas de gestión para monitorear y mantener clústeres de Kafka.
Formato del curso
- Clases interactivas con discusión.
- Numerosos ejercicios y prácticas.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para coordinar.
Apache Kafka Connect
7 HorasEsta capacitación en vivo, impartida por un instructor en Colombia (en línea o en el sitio), está dirigida a desarrolladores que deseen integrar Apache Kafka con bases de datos y aplicaciones existentes para procesos de procesamiento, análisis, entre otros.
Al finalizar esta capacitación, los participantes serán capaces de:
- Utilizar Kafka Connect para ingerir grandes cantidades de datos desde una base de datos hacia tópicos de Kafka.
- Ingerir datos de registro generados por servidores de aplicaciones hacia tópicos de Kafka.
- Disponibilizar cualquier dato recolectado para procesamiento en tiempo real.
- Exportar datos desde tópicos de Kafka hacia sistemas secundarios para su almacenamiento y análisis.
Confluent Apache Kafka: Operaciones y Configuración de Clústeres
16 HorasConfluent Apache Kafka es una plataforma de streaming de eventos distribuida de nivel empresarial construida sobre Apache Kafka. Soporta pipelines de datos de alto rendimiento, tolerantes a fallos y aplicaciones de streaming en tiempo real.
Esta capacitación, impartida por un instructor en vivo (en línea o en sitio), está dirigida a ingenieros y administradores de nivel intermedio que deseen desplegar, configurar y optimizar clústeres de Confluent Kafka en entornos de producción.
Al finalizar esta capacitación, los participantes podrán:
- Instalar, configurar y operar clústeres de Confluent Kafka con múltiples brokers.
- Diseñar configuraciones de alta disponibilidad utilizando Zookeeper y técnicas de replicación.
- Ajustar el rendimiento, monitorear métricas y aplicar estrategias de recuperación.
- Garantizar la seguridad, escalar e integrar Kafka con entornos empresariales.
Formato del Curso
- Clases interactivas y discusiones.
- Numerosos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para coordinarlo.
Creación de soluciones Kafka con Confluent
14 HorasEsta capacitación en vivo, impartida por un instructor (en línea o en sitio), está dirigida a ingenieros que desean utilizar Confluent (una distribución de Kafka) para construir y gestionar una plataforma de procesamiento de datos en tiempo real para sus aplicaciones.
Al finalizar esta capacitación, los participantes serán capaces de:
- Instalar y configurar la Plataforma Confluent.
- Utilizar las herramientas y servicios de gestión de Confluent para ejecutar Kafka de manera más sencilla.
- Almacenar y procesar datos de entrada en forma de flujos.
- Optimizar y gestionar clústeres de Kafka.
- Asegurar los flujos de datos.
Formato del curso
- Clases interactivas y discusiones.
- Numerosos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Este curso se basa en la versión de código abierto de Confluent: Confluent Open Source.
- Para solicitar una capacitación personalizada para este curso, póngase en contacto con nosotros para coordinarlo.
Creación de Pipelines de Datos con Apache Kafka
7 HorasApache Kafka es una plataforma de transmisión distribuida. De hecho, se ha convertido en el estándar para la construcción de pipelines de datos y resuelve una gran variedad de casos de uso en el procesamiento de datos: puede utilizarse como cola de mensajes, registro distribuido, procesador de streams, entre otros.
Comenzaremos con los fundamentos teóricos de los pipelines de datos en general, para luego profundizar en los conceptos esenciales de Kafka. También exploraremos componentes clave como Kafka Streams y Kafka Connect.
Una introducción práctica al procesamiento de flujo
21 HorasEn esta capacitación en vivo impartida por un instructor en Colombia (presencial o remota), los participantes aprenderán a configurar e integrar diferentes marcos de trabajo de procesamiento de flujos con sistemas de almacenamiento de big data existentes, así como con aplicaciones de software relacionadas y microservicios.
Al finalizar esta capacitación, los participantes estarán en capacidad de:
- Instalar y configurar diferentes marcos de trabajo de procesamiento de flujos, como Spark Streaming y Kafka Streaming.
- Comprender y seleccionar el marco de trabajo más adecuado para cada tarea.
- Procesar datos de manera continua, concurrente y registro por registro.
- Integrar soluciones de procesamiento de flujos con bases de datos existentes, almacenes de datos, lagos de datos, entre otros.
- Integrar la biblioteca de procesamiento de flujos más adecuada con aplicaciones empresariales y microservicios.
Mensajería Distribuida con Apache Kafka
14 HorasEste curso está diseñado para arquitectos empresariales, desarrolladores, administradores de sistemas y cualquier persona interesada en comprender y utilizar un sistema de mensajería distribuida de alto rendimiento. Si tiene requisitos más específicos (por ejemplo, solo el aspecto de administración de sistemas), este curso puede adaptarse para satisfacer mejor sus necesidades.
Kafka para Administradores
21 HorasEsta capacitación presencial, impartida por un instructor en Colombia (en línea o en el sitio), está dirigida a administradores de sistemas e ingenieros de operaciones de nivel principiante, intermedio o avanzado que desean utilizar Apache Kafka para desplegar, asegurar, monitorear y solucionar problemas de clústeres de Kafka.
Al finalizar esta capacitación, los participantes podrán: explicar la arquitectura de Kafka y el modo KRaft, operar y asegurar clústeres de Kafka, monitorear el rendimiento y la confiabilidad, y resolver problemas comunes de producción.
Apache Kafka para Desarrolladores
21 HorasEsta capacitación presencial, impartida por un instructor en Colombia (en línea o en el sitio), está dirigida a desarrolladores de nivel intermedio que deseen desarrollar aplicaciones de big data con Apache Kafka.
Al finalizar esta capacitación, los participantes serán capaces de:
- Desarrollar productores y consumidores de Kafka para enviar y leer datos desde Kafka.
- Integrar Kafka con sistemas externos utilizando Kafka Connect.
- Escribir aplicaciones de streaming con Kafka Streams y ksqlDB.
- Integrar una aplicación cliente de Kafka con Confluent Cloud para implementaciones de Kafka basadas en la nube.
- Adquirir experiencia práctica mediante ejercicios prácticos y casos de uso del mundo real.
Apache Kafka para Programadores en Python
7 HorasEsta capacitación presencial, impartida por un instructor en Colombia (en línea o en sitio), está dirigida a ingenieros de datos, científicos de datos y programadores que deseen utilizar las funciones de Apache Kafka en el streaming de datos con Python.
Al finalizar esta capacitación, los participantes serán capaces de utilizar Apache Kafka para monitorear y gestionar condiciones en flujos de datos continuos mediante programación en Python.
Fundamentos de Kafka para Desarrolladores Java
14 HorasEsta capacitación presencial impartida por un instructor en Colombia (en línea o en sitio) está dirigida a desarrolladores Java de nivel intermedio que deseen integrar Apache Kafka en sus aplicaciones para lograr mensajería confiable, escalable y de alto rendimiento.
Al finalizar esta capacitación, los participantes podrán:
- Comprender la arquitectura y los componentes centrales de Kafka.
- Configurar y establecer un clúster de Kafka.
- Producir y consumir mensajes utilizando Java.
- Implementar Kafka Streams para el procesamiento de datos en tiempo real.
- Asegurar la tolerancia a fallos y la escalabilidad en las aplicaciones de Kafka.
Administración de la Cola de Mensajes Kafka
14 HorasEsta capacitación en vivo, impartida por un instructor en Colombia (en línea o en sitio), está dirigida a administradores de sistemas de nivel intermedio que desean aprovechar de manera efectiva las funciones de cola de mensajes de Kafka.
Al finalizar esta capacitación, los participantes serán capaces de:
- Comprender las capacidades y la arquitectura de la cola de mensajes de Kafka.
- Configurar los temas de Kafka para escenarios de colas de mensajes.
- Producir y consumir mensajes utilizando Kafka.
- Monitorear y administrar Kafka como una cola de mensajes.
Seguridad para Apache Kafka
7 HorasEsta capacitación en vivo impartida por un instructor en Colombia (en línea o en sitio) está dirigida a probadores de software que deseen implementar medidas de seguridad de red en una aplicación de Apache Kafka.
Al finalizar esta capacitación, los participantes serán capaces de:
- Desplegar Apache Kafka en un servidor basado en la nube.
- Implementar cifrado SSL para prevenir ataques.
- Agregar autenticación ACL para rastrear y controlar el acceso de los usuarios.
- Asegurar que los clientes confiables tengan acceso a los clústeres de Kafka mediante autenticación SSL y SASL.
Apache Kafka y Spring Boot
7 HorasEsta capacitación en vivo impartida por un instructor en Colombia (en línea o presencial) está dirigida a desarrolladores de nivel intermedio que deseen aprender los fundamentos de Kafka e integrarlo con Spring Boot.
Al finalizar esta capacitación, los participantes podrán:
- Comprender Kafka y su arquitectura.
- Aprender cómo instalar, configurar y establecer un entorno básico de Kafka.
- Integrar Kafka con Spring Boot.
Administración de Tópicos de Kafka
14 HorasEsta capacitación en vivo, impartida por un instructor en Colombia (en línea o en sitio), está dirigida a administradores de sistemas de nivel principiante a intermedio que deseen aprender a gestionar eficazmente los tópicos de Kafka para optimizar el streaming y procesamiento de datos.
Al finalizar esta capacitación, los participantes podrán:
- Comprender los fundamentos y la arquitectura de los tópicos de Kafka.
- Crear, configurar y administrar tópicos de Kafka.
- Monitorear tópicos de Kafka en cuanto a salud, rendimiento y disponibilidad.
- Implementar medidas de seguridad para los tópicos de Kafka.