Programa del Curso

Introducción

Descripción general de Data Cleaning

  • ¿Por qué es importante Data Cleaning?

Caso práctico: Cuando Big Data está sucio

Desarrollo de una estrategia exhaustiva Data Cleaning

Herramientas comunes Data Cleaning

  • Pato
  • Abrir Refinar
  • Pandas (para Python)
  • Dplyr (para R)

Lograr una alta integridad de los datos

  • Íntegro
  • Correcto
  • Preciso
  • Pertinente
  • Consistente

Automatización del proceso Data Cleaning

Supervisión del sistema Data Cleaning

Resumen y conclusión

Requerimientos

  • Comprensión de los conceptos de análisis de datos.

Audiencia

  • Científicos de datos
  • Analistas de datos
  • Business Analistas
 7 horas

Número de participantes



Precio por participante

Testimonios (2)

Cursos Relacionados

Excel para el Análisis Estadístico de Datos

14 horas

Análisis de Datos con R

21 horas

Análisis de Datos con Hive / HiveQL

7 horas

Análisis de Datos en Python Usando Pandas y Numpy

14 horas

Descubrir Conocimiento en Bases de Datos

21 horas

Procesamiento de Lenguaje Natural (NLP) con R

21 horas

Una introducción práctica al análisis de datos y Big Data

35 horas

ElasticSearch para desarrolladores: creación de soluciones de búsqueda y análisis con Elasticsearch

14 horas

Fundamentos de MATLAB, Ciencia de datos y generación de informes

35 horas

Datos y análisis: desde cero

42 horas

Nivel Avanzado de SQL para Analistas

21 horas

Apache Kylin: Del clásico OLAP al almacén de datos en tiempo real

14 horas

Datameer para Analistas de Datos

14 horas

Embedding Projector: Visualización de sus Datos de Entrenamiento

14 horas

kdb + yq: Analizan Datos de Series de Tiempo

21 horas

Categorías Relacionadas