Temario del curso
Introducción al análisis de datos y al Big Data
- ¿Qué hace que el Big Data sea "grande"?
- Velocidad, Volumen, Variedad y Veracidad (VVVV)
- Límites del procesamiento tradicional de datos
- Procesamiento distribuido
- Análisis estadístico
- Tipos de análisis de aprendizaje automático
- Visualización de datos
Roles y responsabilidades en el ámbito del Big Data
- Administradores
- Desarrolladores
- Analistas de datos
Lenguajes utilizados para el análisis de datos
- Lenguaje R
- ¿Por qué usar R para el análisis de datos?
- Manipulación de datos, cálculos y visualización gráfica
- Python
- ¿Por qué usar Python para el análisis de datos?
- Manipulación, procesamiento, limpieza y análisis intensivo de datos
Enfoques para el análisis de datos
- Análisis estadístico
- Análisis de series de tiempo
- Proyecciones con modelos de correlación y regresión
- Estadística inferencial (estimación)
- Estadística descriptiva en conjuntos de datos de Big Data (por ejemplo, cálculo de la media)
- Aprendizaje automático
- Aprendizaje supervisado frente a no supervisado
- Clasificación y agrupamiento
- Estimación del costo de métodos específicos
- Filtrado
- Procesamiento del lenguaje natural
- Procesamiento de texto
- Comprensión del significado del texto
- Generación automática de texto
- Análisis de sentimientos y de temas
- Visión por computador
- Adquisición, procesamiento, análisis y comprensión de imágenes
- Reconstrucción, interpretación y comprensión de escenas en 3D
- Uso de datos de imágenes para la toma de decisiones
Infraestructura para Big Data
- Almacenamiento de datos
- Bases de datos relacionales (SQL)
- MySQL
- Postgres
- Oracle
- Bases de datos no relacionales (NoSQL)
- Cassandra
- MongoDB
- Neo4js
- Comprensión de los matices
- Bases de datos jerárquicas
- Bases de datos orientadas a objetos
- Bases de datos orientadas a documentos
- Bases de datos orientadas a grafos
- Otras
- Bases de datos relacionales (SQL)
- Procesamiento distribuido
- Hadoop
- HDFS como sistema de archivos distribuido
- MapReduce para procesamiento distribuido
- Spark
- Marco de computación en clúster en memoria todo en uno para procesamiento de datos a gran escala
- Transmisión estructurada
- Spark SQL
- Bibliotecas de aprendizaje automático: MLlib
- Procesamiento de grafos con GraphX
- Hadoop
- Escalabilidad
- Nube pública
- AWS, Google, Aliyun, etc.
- Nube privada
- OpenStack, Cloud Foundry, etc.
- Escalabilidad automática
- Nube pública
Elegir la solución adecuada para el problema
El futuro del Big Data
Resumen y siguientes pasos
Requerimientos
- Conocimiento general de matemáticas
- Conocimiento general de programación
- Conocimiento general de bases de datos
Público objetivo
- Desarrolladores y programadores
- Consultores de TI
Testimonios (7)
Cómo funciona el big data, los programas de datos, y un mayor conocimiento de cómo funciona nuestro mundo actual utilizando datos
Ozayr Hussain - Vodacom
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
El lado práctico del entrenamiento.
Patrick - Vodacom PTy Ltd
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
Temas interactivos y el estilo utilizado por el conferencista para simplificar los temas para los estudiantes
Miran Saeed - Sulaymaniyah Asayish Agency
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
el formador y su capacidad para impartir conferencias
ibrahim hamakarim - Sulaymaniyah Asayish Agency
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
Ejercicios prácticos
JOEL CHIGADA - University of the Western Cape
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
programación R
Osden Jokonya - University of the Western Cape
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
Overall the Content was good.
Sameer Rohadia
Curso - A practical introduction to Data Analysis and Big Data
Traducción Automática