Fundamentos de Integración de Datos Pentaho
Pentaho Data Integration es una herramienta de código abierto para la integración de datos, diseñada para definir trabajos y transformaciones de datos.
En esta capacitación en vivo impartida por un instructor, los participantes aprenderán a aprovechar las potentes capacidades ETL y la rica interfaz gráfica de Pentaho Data Integration para gestionar todo el ciclo de vida de los grandes volúmenes de datos y maximizar el valor de la información dentro de su organización.
Al finalizar esta capacitación, los participantes podrán:
- Crear, previsualizar y ejecutar transformaciones básicas de datos que incluyen pasos y conexiones.
- Configurar y asegurar el Repositorio Empresarial de Pentaho.
- Integrar diversas fuentes de datos y generar una versión única y unificada de la verdad en un formato listo para análisis.
- Proporcionar los resultados a aplicaciones de terceros para su posterior procesamiento.
Público objetivo
- Analistas de datos.
- Desarrolladores ETL.
Formato del curso
- Combinación de exposición teórica, discusión grupal, ejercicios y práctica intensiva guiada.
Temario del curso
Introducción
Instalación y configuración de Pentaho
Visión general de las características y arquitectura de Pentaho
Comprensión de la memoria caché en memoria de Pentaho
Navegación por la interfaz de usuario
Conexión a una fuente de datos
Configuración del Repositorio Empresarial de Pentaho
Transformación de datos
Visualización de los resultados de la transformación
Resolución de errores en las transformaciones
Procesamiento de un flujo de datos
Reutilización de transformaciones
Programación de transformaciones
Seguridad en Pentaho
Integración con aplicaciones de terceros (Hadoop, NoSQL, etc.)
Análisis y reportes
Patrones de diseño y mejores prácticas en Pentaho
Solución de problemas
Resumen y conclusión
Requerimientos
- Conocimiento de bases de datos relacionales.
- Conocimiento de almacenamiento de datos (data warehousing).
- Comprensión de los conceptos ETL (Extracción, Transformación y Carga).
Los cursos públicos requieren más de 5 participantes.
Fundamentos de Integración de Datos Pentaho - Reserva
Fundamentos de Integración de Datos Pentaho - Consulta
Fundamentos de Integración de Datos Pentaho - Solicitud de consultoría
Testimonios (1)
Que fue muy priactico.
Alfonso Ramos - Banco de Mexico
Curso - Fundamentos de Integración de Datos Pentaho
Próximos cursos
Cursos Relacionados
KNIME Analytics Platform para BI
21 HorasKNIME Analytics Platform es una de las opciones líderes de código abierto para la innovación basada en datos, ayudándote a descubrir el potencial oculto en tus datos, extraer nuevas ideas o predecir futuros escenarios. Con más de 1000 módulos, cientos de ejemplos listos para ejecutar, una amplia gama de herramientas integradas y la mayor variedad de algoritmos avanzados disponibles, KNIME Analytics Platform es la caja de herramientas ideal para cualquier científico de datos y analista de negocios.
Este curso sobre KNIME Analytics Platform es una oportunidad ideal para principiantes, usuarios avanzados y expertos en KNIME para conocer la plataforma, aprender a usarla de manera más efectiva y crear informes claros y completos basados en flujos de trabajo de KNIME.
Plataforma analítica KNIME - capacitación integral
35 HorasLa capacitación "Plataforma analítica KNIME" ofrece una visión integral de esta plataforma gratuita de análisis de datos. El programa incluye una introducción al procesamiento y análisis de datos, la instalación y configuración de KNIME, la creación de flujos de trabajo (workflows), la metodología para desarrollar modelos empresariales y de datos. El curso también aborda herramientas de análisis avanzado, la importación y exportación de flujos de trabajo, la integración de herramientas, los procesos ETL, la exploración de datos, la visualización, así como extensiones e integraciones con herramientas como R, Java, Python, Gephi y Neo4j. La conclusión incluye una explicación sobre la generación de informes y la integración con BIRT y KNIME WebPortal.
Oracle GoldenGate
14 HorasEsta capacitación presencial impartida por un instructor en Colombia (en línea o en sitio) está dirigida a administradores de sistemas y desarrolladores que desean configurar, implementar y gestionar Oracle GoldenGate para la transformación de datos.
Al finalizar esta capacitación, los participantes estarán en capacidad de:
- Instalar y configurar Oracle GoldenGate.
- Comprender la replicación de bases de datos Oracle utilizando la herramienta Oracle GoldenGate.
- Entender la arquitectura de Oracle GoldenGate.
- Configurar y ejecutar la replicación y migración de bases de datos.
- Optimizar el rendimiento de Oracle GoldenGate y solucionar problemas.
Pentaho Open Source BI Suite Community Edition (CE)
28 HorasLa Edición Comunitaria (CE) de la Suite BI de Código Abierto de Pentaho es un paquete de inteligencia de negocios que ofrece capacidades de integración de datos, generación de informes, creación de paneles de control y carga de información.
En este entrenamiento presencial impartido por un instructor, los participantes aprenderán a aprovechar al máximo las funciones de la Edición Comunitaria (CE) de la Suite BI de Código Abierto de Pentaho.
Al finalizar este entrenamiento, los participantes serán capaces de:
- Instalar y configurar la Edición Comunitaria (CE) de la Suite BI de Código Abierto de Pentaho.
- Comprender los fundamentos de las herramientas de Pentaho CE y sus características.
- Elaborar informes utilizando Pentaho CE.
- Integrar datos de terceros en Pentaho CE.
- Trabajar con big data y análisis en Pentaho CE.
Público objetivo
- Programadores
- Desarrolladores de BI
Formato del curso
- Una combinación de clases magistrales, discusiones, ejercicios y prácticas intensivas con participación activa.
Nota
- Para solicitar un entrenamiento personalizado para este curso, por favor contáctenos para coordinarlo.
Integración Avanzada de Datos con Pentaho
21 HorasPentaho Data Integration es una plataforma integral para el diseño de procesos ETL y pipelines de datos de nivel empresarial.
Esta formación presencial, impartida por un instructor (en línea o en sede), está dirigida a ingenieros de nivel avanzado que deseen dominar soluciones PDI de alto rendimiento, escalabilidad empresarial y alto grado de automatización.
Al finalizar este curso, los participantes estarán capacitados para:
- Diseñar arquitecturas de pipelines ETL a gran escala con orquestación avanzada.
- Optimizar transformaciones complejas para obtener el máximo rendimiento.
- Implementar patrones de script, automatización e integración híbrida.
- Diseñar flujos de trabajo robustos, mantenibles y listos para producción.
Formato del curso
- Demostraciones guiadas por expertos y análisis de arquitectura.
- Prácticas intensivas en laboratorios con desafíos ETL reales de nivel avanzado.
- Desarrollo práctico en un entorno similar al de producción.
Opciones de personalización del curso
- Contáctenos si requiere una versión personalizada de esta formación.
Integración de Datos Pentaho Intermedio
21 HorasPentaho Data Integration es una plataforma de extracción, transformación y carga de datos.
Esta formación impartida por un instructor, en vivo (en línea o en sitio), está dirigida a profesionales de nivel intermedio que deseen mejorar sus habilidades en PDI para escenarios de transformación más complejos.
Al finalizar esta formación, los participantes podrán:
- Diseñar transformaciones de múltiples pasos con un rendimiento optimizado.
- Trabajar con variables, parámetros y componentes reutilizables.
- Integrar PDI con bases de datos, APIs y sistemas externos.
- Aplicar las mejores prácticas para crear pipelines ETL mantenibles y escalables.
Formato del curso
- Demostraciones interactivas y explicaciones del instructor.
- Ejercicios guiados y práctica basada en escenarios reales.
- Trabajo práctico en un entorno real de proyectos ETL.
Opciones de personalización del curso
- Si necesita una versión adaptada de este curso, por favor contáctenos para personalizarlo.
Algoritmos de Fusión de Datos
14 HorasLa fusión de sensores consiste en combinar e integrar datos provenientes de múltiples sensores para ofrecer una visión más precisa, confiable y contextualizada de la información.
Las implementaciones de fusión de sensores requieren el uso de algoritmos capaces de filtrar y integrar diversas fuentes de datos.
Público objetivo
Este curso está dirigido a ingenieros, programadores y arquitectos de software que trabajan con implementaciones multisensor.
Centro de Administración de Talend (TAC)
14 HorasEsta formación presencial, impartida por un instructor en Colombia (en línea o en el sitio), está dirigida a administradores de sistemas, científicos de datos y analistas de negocio que deseen configurar el Centro de Administración de Talend para desplegar y gestionar los roles y tareas de la organización.
Al finalizar esta formación, los participantes serán capaces de:
- Instalar y configurar el Centro de Administración de Talend.
- Comprender e implementar los fundamentos de la gestión en Talend.
- Construir, desplegar y ejecutar proyectos o tareas empresariales en Talend.
- Monitorear la seguridad de los conjuntos de datos y desarrollar rutinas empresariales basadas en el marco de trabajo del TAC.
- Obtener una comprensión más amplia de las aplicaciones de big data.
Integración de Big Data con Talend
28 HorasEsta capacitación impartida por un instructor, en vivo en Colombia (en línea o presencial), está dirigida a profesionales técnicos que desean implementar Talend Open Studio para Big Data y simplificar los procesos de lectura y análisis de grandes volúmenes de datos.
Al finalizar esta capacitación, los participantes estarán en capacidad de:
- Instalar y configurar Talend Open Studio para Big Data.
- Conectarse a sistemas de Big Data como Cloudera, HortonWorks, MapR, Amazon EMR y Apache.
- Comprender y configurar los componentes y conectores de Big Data de Open Studio.
- Configurar parámetros para generar automáticamente código MapReduce.
- Utilizar la interfaz de arrastrar y soltar de Open Studio para ejecutar trabajos de Hadoop.
- Prototipar pipelines de Big Data.
- Automatizar proyectos de integración de Big Data.
Talend Cloud
7 HorasEsta capacitación impartida por un instructor, en vivo en Colombia (en línea o en sitio), está dirigida a administradores y desarrolladores de datos que deseen gestionar, monitorear y operar procesos de integración de datos utilizando los servicios de Talend Cloud.
Al finalizar esta capacitación, los participantes estarán en capacidad de:
- Navegar por la consola de administración de Talend para gestionar usuarios y roles en la plataforma.
- Evaluar los datos para identificar y comprender conjuntos de datos relevantes.
- Crear una tubería (pipeline) para procesar y monitorear datos en reposo o en movimiento.
- Preparar los datos para su análisis y generar información valiosa para el negocio.
Gobernanza de Datos de Talend
14 HorasEste entrenamiento presencial, impartido por un instructor en Colombia (en línea o en sitio), está dirigido a analistas de datos de nivel principiante a intermedio que deseen profundizar su comprensión y habilidades en la gestión y mejora de la calidad de datos mediante Talend Data Stewardship.
Al finalizar este entrenamiento, los participantes podrán:
- Alcanzar una comprensión integral del rol de la gobernanza de datos en el mantenimiento de la calidad de los datos.
- Utilizar Talend Data Stewardship para gestionar tareas relacionadas con la calidad de datos.
- Crear, asignar y administrar tareas dentro de Talend Data Stewardship, incluyendo la personalización de flujos de trabajo.
- Aprovechar las capacidades de informes y monitoreo de la herramienta para rastrear la calidad de datos y los esfuerzos de gobernanza.
Talend Open Studio para ESB
21 HorasEn esta capacitación presencial impartida por un instructor en Colombia, los participantes aprenderán a utilizar Talend Open Studio para ESB con el fin de crear, conectar, mediar y gestionar servicios y sus interacciones.
Al finalizar este entrenamiento, los participantes estarán en capacidad de
- Integrar, mejorar y entregar tecnologías ESB como paquetes únicos en diversos entornos de implementación.
- Comprender y utilizar los componentes más empleados de Talend Open Studio.
- Integrar cualquier aplicación, base de datos, API o servicios web.
- Integrar sin fricciones sistemas y aplicaciones heterogéneos.
- Incorporar bibliotecas de código Java existentes para ampliar los proyectos.
- Aprovechar componentes y código de la comunidad para extender los proyectos.
- Integrar rápidamente sistemas, aplicaciones y fuentes de datos en un entorno de arrastrar y soltar de Eclipse.
- Reducir el tiempo de desarrollo y los costos de mantenimiento mediante la generación de código optimizado y reutilizable.