Contacta con nosotros

Temario del curso

Introducción al análisis de datos y al Big Data

  • ¿Qué hace que el Big Data sea "grande"?
    • Velocidad, Volumen, Variedad y Veracidad (VVVV)
  • Límites del procesamiento tradicional de datos
  • Procesamiento distribuido
  • Análisis estadístico
  • Tipos de análisis de aprendizaje automático
  • Visualización de datos

Roles y responsabilidades en el ámbito del Big Data

  • Administradores
  • Desarrolladores
  • Analistas de datos

Lenguajes utilizados para el análisis de datos

  • Lenguaje R
    • ¿Por qué usar R para el análisis de datos?
    • Manipulación de datos, cálculos y visualización gráfica
  • Python
    • ¿Por qué usar Python para el análisis de datos?
    • Manipulación, procesamiento, limpieza y análisis intensivo de datos

Enfoques para el análisis de datos

  • Análisis estadístico
    • Análisis de series de tiempo
    • Proyecciones con modelos de correlación y regresión
    • Estadística inferencial (estimación)
    • Estadística descriptiva en conjuntos de datos de Big Data (por ejemplo, cálculo de la media)
  • Aprendizaje automático
    • Aprendizaje supervisado frente a no supervisado
    • Clasificación y agrupamiento
    • Estimación del costo de métodos específicos
    • Filtrado
  • Procesamiento del lenguaje natural
    • Procesamiento de texto
    • Comprensión del significado del texto
    • Generación automática de texto
    • Análisis de sentimientos y de temas
  • Visión por computador
    • Adquisición, procesamiento, análisis y comprensión de imágenes
    • Reconstrucción, interpretación y comprensión de escenas en 3D
    • Uso de datos de imágenes para la toma de decisiones

Infraestructura para Big Data

  • Almacenamiento de datos
    • Bases de datos relacionales (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Bases de datos no relacionales (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4js
    • Comprensión de los matices
      • Bases de datos jerárquicas
      • Bases de datos orientadas a objetos
      • Bases de datos orientadas a documentos
      • Bases de datos orientadas a grafos
      • Otras
  • Procesamiento distribuido
    • Hadoop
      • HDFS como sistema de archivos distribuido
      • MapReduce para procesamiento distribuido
    • Spark
      • Marco de computación en clúster en memoria todo en uno para procesamiento de datos a gran escala
      • Transmisión estructurada
      • Spark SQL
      • Bibliotecas de aprendizaje automático: MLlib
      • Procesamiento de grafos con GraphX
  • Escalabilidad
    • Nube pública
      • AWS, Google, Aliyun, etc.
    • Nube privada
      • OpenStack, Cloud Foundry, etc.
    • Escalabilidad automática

Elegir la solución adecuada para el problema

El futuro del Big Data

Resumen y siguientes pasos

Requerimientos

  • Conocimiento general de matemáticas
  • Conocimiento general de programación
  • Conocimiento general de bases de datos

Público objetivo

  • Desarrolladores y programadores
  • Consultores de TI
 35 Horas

Número de participantes


Precio por participante

Testimonios (7)

Próximos cursos

Categorías Relacionadas