Programa del Curso

Introducción

    El proceso Data Science Funciones y responsabilidades de un Data Scientist

Preparación del entorno de desarrollo

    Bibliotecas, frameworks, lenguajes y herramientas Desarrollo local Desarrollo colaborativo basado en la web

Recogida de datos

    Diferentes tipos de datos Estructurado  Bases de datos locales Conectores de base de datos Formatos comunes: xlxs, XML, Json, csv, ...
No estructurado No soy un hace 10 años, hace 2015-20
  • Apis
  • Internet of Things (IoT)
  • Documentos, fotografías, vídeos, sonidos
  • Caso práctico: Recopilación continua de grandes cantidades de datos no estructurados
  • Almacenamiento de datos Bases de datos relacionales Bases de datos no relacionales Hadoop: Sistema de archivos distribuido (HDFS) Spark: conjunto de datos distribuidos resistente (RDD) Almacenamiento en la nube
  • Preparación de datos
  • Ingestión, selección, limpieza y transformación Garantizar la calidad de los datos: corrección, significado y seguridad Informes de excepción

      Languages utilizado para la preparación, el procesamiento y el análisis

    Lenguaje R Introducción a R Manipulación de datos, cálculo y visualización gráfica

      Python Introducción a Python

    Manipulación, procesamiento, limpieza y procesamiento de datos

      Análisis de datos
    Análisis exploratorio Estadísticas básicas Visualizaciones de borrador Comprender los datos 
  • Causalidad
  • Características y transformaciones
  • Machine Learning Supervisado vs no supervisado

      Cuándo usar qué modelo
    Natural Language Processing (NLP)
  • Data Visualization
  • Prácticas recomendadas Seleccionar el gráfico correcto para los datos correctos Paletas de colores Llevándolo al siguiente nivel Paneles Visualizaciones interactivas
  • Storytelling con datos
  • Resumen y conclusión
  • Requerimientos

    • Una comprensión general de los conceptos de bases de datos
    • Conocimientos básicos de estadística
     35 horas

    Número de participantes



    Precio por participante

    Testimonios (2)

    Cursos Relacionados

    Kaggle

    14 horas

    Accelerating Python Pandas Workflows with Modin

    14 horas

    GPU Data Science with NVIDIA RAPIDS

    14 horas

    Anaconda Ecosystem for Data Scientists

    14 horas

    ArcGIS for Spatial Analysis

    14 horas

    ArcMap in ArcGIS

    14 horas

    ArcGIS Pro for Spatial Analysis

    14 horas

    ArcGIS with Python Scripting

    14 horas

    QGIS para el Sistema de Información Geográfica

    21 horas

    Sensu: Beginner to Advanced

    14 horas

    Supervisando sus Recursos con Munin

    7 horas

    Supervisión Automatizada con Zabbix

    14 horas

    Fluentd for Log Data Unification

    14 horas

    Nagios Certified Administrator Preparation

    21 horas

    Advanced Nagios

    21 horas

    Categorías Relacionadas

    1