Contacta con nosotros

Temario del curso

Introducción a la plataforma Stratio

  • Visión general de la arquitectura de Stratio y sus módulos principales
  • Función de Rocket e Inteligencia en el ciclo de vida de los datos
  • Inicio de sesión y navegación por la interfaz de usuario de Stratio

Trabajo con el módulo Rocket

  • Ingestión de datos y creación de pipelines
  • Conexión de fuentes de datos y configuración de transformaciones
  • Uso de PySpark para tareas de preprocesamiento en Rocket

Conceptos esenciales de PySpark para usuarios de Stratio

  • Estructuras y operaciones de datos en PySpark
  • Construcciones de bucle: uso de for, while, if/else
  • Escritura de funciones personalizadas con def y su aplicación

Uso avanzado de Rocket con PySpark

  • Ingestión y transformaciones en streaming
  • Uso de bucles y funciones en escenarios por lotes y en tiempo real
  • Mejores prácticas para el rendimiento en pipelines de PySpark

Exploración del módulo Inteligencia

  • Visión general de las funciones de modelado y análisis de datos
  • Selección, transformación y exploración de características
  • Función de PySpark en análisis e insights personalizados

Construcción de flujos de trabajo de análisis avanzado

  • Creación de funciones definidas por el usuario (UDF) en Inteligencia
  • Aplicación de condicionales y bucles para la lógica de datos
  • Casos de uso: segmentación, agregación y predicción

Despliegue y colaboración

  • Guardado, exportación y reutilización de flujos de trabajo
  • Colaboración con otros miembros del equipo en Stratio
  • Revisión de resultados e integración con herramientas aguas abajo

Resumen y próximos pasos

Requerimientos

  • Experiencia en programación con Python
  • Comprensión de conceptos de análisis de datos o procesamiento de big data
  • Conocimientos básicos de Apache Spark y computación distribuida

Público objetivo

  • Ingenieros de datos que trabajan en plataformas basadas en Stratio
  • Analistas o desarrolladores que utilizan los módulos Rocket e Inteligencia
  • Equipos técnicos que están transitando hacia flujos de trabajo con PySpark dentro de Stratio
 14 Horas

Número de participantes


Precio por participante

Testimonios (2)

Próximos cursos

Categorías Relacionadas