Contacta con nosotros

Temario del curso

Introducción a los ecosistemas de Big Data

  • Visión general de tecnologías y arquitecturas de big data
  • Procesamiento por lotes frente a procesamiento en tiempo real
  • Estrategias de almacenamiento de datos para escalabilidad

Procesamiento avanzado de datos con Apache Spark

  • Optimización de trabajos de Spark para mejorar el rendimiento
  • Transformaciones y acciones avanzadas
  • Trabajo con transmisión estructurada

Aprendizaje automático a gran escala

  • Técnicas de entrenamiento distribuido de modelos
  • Ajuste de hiperparámetros en grandes conjuntos de datos
  • Despliegue de modelos en entornos de big data

Aprendizaje profundo para Big Data

  • Integración de TensorFlow y PyTorch con Spark
  • Pipelines de entrenamiento distribuido de aprendizaje profundo
  • Casos de uso en análisis de imágenes, texto y series temporales

Análisis en tiempo real y transmisión de datos

  • Apache Kafka para la ingesta de datos en streaming
  • Marcos de procesamiento de flujos de datos
  • Monitoreo y alertas en sistemas en tiempo real

Gobernanza, seguridad y ética de los datos

  • Requisitos de privacidad y cumplimiento normativo de los datos
  • Control de acceso y cifrado en sistemas de big data
  • Consideraciones éticas en el análisis a gran escala

Integración de Big Data con inteligencia empresarial

  • Visualización de datos y creación de paneles para big data
  • Conexión de pipelines de big data con herramientas de BI
  • Impulso de resultados empresariales mediante análisis avanzados

Resumen y próximos pasos

Requerimientos

  • Sólido conocimiento de los conceptos de análisis de datos y modelado estadístico
  • Experiencia con herramientas de procesamiento de datos y lenguajes de programación como Python, R o Scala
  • Familiaridad con marcos de computación distribuida como Hadoop o Spark

Público objetivo

  • Científicos de datos que buscan dominar el procesamiento de datos a gran escala y el análisis predictivo
  • Analistas senior que deseen diseñar e implementar flujos de trabajo analíticos avanzados
  • Profesionales de I+D enfocados en soluciones innovadoras basadas en datos
 42 Horas

Número de participantes


Precio por participante

Testimonios (2)

Próximos cursos

Categorías Relacionadas