Curso de Minería de Datos y Aprendizaje Automático con R
R es un lenguaje de programación gratuito de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número cada vez mayor de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R tiene una amplia variedad de paquetes para la minería de datos.
Programa del Curso
Introducción a la minería de datos y Machine Learning
- Aprendizaje estadístico vs. aprendizaje automático
- Iteración y evaluación
- Compensación entre sesgo y varianza
Regresión
- Regresión lineal
- Generalizaciones y no linealidad
- Ejercicios
Clasificación
- Repaso bayesiano
- Bayes ingenuo
- Análisis discriminatorio
- Regresión logística
- K-Vecinos más cercanos
- Máquinas de vectores de soporte
- Redes neuronales
- Árboles de decisión
- Ejercicios
Validación cruzada y remuestreo
- Enfoques de validación cruzada
- Bootstrap
- Ejercicios
Unsupervised Learning
- Agrupamiento de K-medias
- Ejemplos
- Desafíos del aprendizaje no supervisado y más allá de K-means
Temas avanzados
- Modelos de ensamble
- Modelos mixtos
- Impulsar
- Ejemplos
Reducción multidimensional
- Análisis Factorial
- Análisis de Componentes Principales
- Ejemplos
Requerimientos
Este curso es parte del conjunto de habilidades del Científico de Datos (Dominio: Técnicas y Métodos Analíticos)
Los cursos de formación abiertos requieren más de 5 participantes.
Curso de Minería de Datos y Aprendizaje Automático con R - Booking
Curso de Minería de Datos y Aprendizaje Automático con R - Enquiry
Minería de Datos y Aprendizaje Automático con R - Consulta de consultoría
Consulta de consultoría
Testimonios (1)
The trainer was so knowledgeable and included areas I was interested in.
Mohamed Salama
Curso - Data Mining & Machine Learning with R
Traducción Automática
Próximos cursos
Cursos Relacionados
De los Datos a la Decisión con Big Data y Análisis Predictivo
21 HorasAudiencia
Si intentas dar sentido a los datos a los que tienes acceso o quieres analizar datos no estructurados disponibles en la red (como Twitter, Linked in, etc...) este curso es para ti.
Está dirigido principalmente a los responsables de la toma de decisiones y a las personas que necesitan elegir qué datos vale la pena recopilar y cuáles vale la pena analizar.
No está dirigido a las personas que configuran la solución, sin embargo, esas personas se beneficiarán del panorama general.
Modo de entrega
Durante el curso, se presentarán a los delegados ejemplos de trabajo de tecnologías de código abierto.
A las conferencias breves les seguirán una presentación y ejercicios sencillos por parte de los participantes
Contenido y software utilizado
Todo el software utilizado se actualiza cada vez que se ejecuta el curso, por lo que comprobamos las versiones más recientes posibles.
Abarca el proceso desde la obtención, formateo, procesamiento y análisis de los datos, hasta explicar cómo automatizar el proceso de toma de decisiones con machine learning.
Minería y Análisis de Datos
28 HorasObjetivo:
Los delegados podrán analizar conjuntos de datos grandes, extraer patrones, elegir la variable adecuada que impacta en los resultados, con el fin de predecir un nuevo modelo con resultados predictivos.
Minería de Datos
21 HorasEl curso se puede proporcionar con cualquier herramienta, incluido el software y las aplicaciones gratuitas de minería de datos de código abierto
Minería de datos con Python
14 HorasEsta formación dirigida por un instructor (en línea o presencial) está destinada a analistas de datos y científicos de datos que desean implementar técnicas avanzadas de análisis de datos para la minería de datos utilizando Python.
Al finalizar esta formación, los participantes podrán:
- Comprender áreas importantes de la minería de datos, incluyendo la minería de reglas de asociación, el análisis del sentimiento del texto, la resumen automático de textos y la detección de anomalías en los datos.
- Comparar e implementar diversas estrategias para resolver problemas reales de minería de datos.
- Comprender e interpretar los resultados.
Formato del Curso
- Charlas interactivas y discusiones.
- Muchos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinar.
Minería de Datos con R
14 HorasR es un lenguaje de programación gratuito de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número cada vez mayor de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R tiene una amplia variedad de paquetes para la minería de datos.
Bóveda de Datos: Creación de un Almacén de Datos Escalable
28 HorasEn esta capacitación en vivo dirigida por un instructor en Colombia, los participantes aprenderán cómo construir un Data Vault.
Al final de esta formación, los participantes serán capaces de:
- Comprender los conceptos de arquitectura y diseño detrás de Data Vault 2.0 y su interacción con Big Data, NoSQL e IA.
- Utilice técnicas de almacenamiento de datos para permitir la auditoría, el seguimiento y la inspección de datos históricos en un almacén de datos.
- Desarrolle un proceso ETL (Extracción, Transformación, Carga) coherente y repetible.
- Construya e implemente almacenes altamente escalables y repetibles.
Visualización de Datos
28 HorasEste curso está dirigido a ingenieros y tomadores de decisiones que trabajan en minería de datos y descubrimiento de conocimientos.
Aprenderá cómo crear diagramas efectivos y formas de presentar y representar sus datos de una manera que atraiga a los tomadores de decisiones y les ayude a comprender la información oculta.
Ciencia de Datos para Big Data Analytics
35 HorasBig data son conjuntos de datos que son tan voluminosos y complejos que el software de aplicación de procesamiento de datos tradicional es inadecuado para manejarlos. Los grandes desafíos de datos incluyen la captura de datos, el almacenamiento de datos, el análisis de datos, la búsqueda, el intercambio, la transferencia, la visualización, la consulta, la actualización y la privacidad de la información.
Fundación R
7 HorasEsta formación en vivo dirigida por un instructor en Colombia (en línea o presencial) está destinada a profesionales principiantes que desean dominar los fundamentos de R y cómo trabajar con datos.
Al finalizar esta formación, los participantes podrán:
- Comprender el entorno de programación R e la interfaz de RStudio.
- Importar, manipular y explorar conjuntos de datos utilizando comandos y paquetes de R.
- Ejecutar análisis estadísticos básicos y resumir datos.
- Generar visualizaciones usando tanto R base como ggplot2.
- Gestionar espacios de trabajo, scripts y paquetes de manera efectiva.
Plataforma de Análisis KNIME para BI
21 HorasKNIME Analytics Platform es una opción líder de código abierto para la innovación basada en datos, que le ayuda a descubrir el potencial oculto en sus datos, extraer información fresca o predecir nuevos futuros. Con más de 1000 módulos, cientos de ejemplos listos para ejecutar, una amplia gama de herramientas integradas y la más amplia selección de algoritmos avanzados disponibles, KNIME Analytics Platform es la caja de herramientas perfecta para cualquier científico de datos y analista de negocios.
Este curso para KNIME Analytics Platform es una oportunidad ideal para que los principiantes, los usuarios avanzados y los KNIME expertos conozcan KNIME, aprendan a utilizarlo de forma más eficaz y a crear informes claros y completos basados en KNIME flujos de trabajo
Oracle SQL Intermedio - Extracción de Datos
14 HorasEl objetivo del curso es permitir a los participantes adquirir un dominio sobre cómo trabajar con el SQL en la base de datos Oracle para la extracción de datos a nivel intermedio.
Minería de Procesos
21 HorasProcess mining o Automated Business Process Discovery (ABPD) es una técnica que aplica algoritmos a los registros de eventos con el fin de analizar procesos comerciales. La minería de procesos va más allá del almacenamiento de datos y el análisis de datos; enlaza los datos con los procesos y proporciona información sobre las tendencias y patrones que afectan la eficiencia del proceso.
Formato del curso
El curso comienza con una descripción general de las técnicas más comúnmente utilizadas para la minería de procesos. Discutimos los diversos algoritmos y herramientas de descubrimiento de procesos utilizados para descubrir y modelar procesos basados en datos de eventos brutos. Se examinan los casos de estudio de la vida real y se analizan los conjuntos de datos utilizando el marco de código abierto ProM.
Introducción R para Biólogos
28 HorasR es un lenguaje de programación libre de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número creciente de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R también ha encontrado seguidores entre los estadísticos, ingenieros y científicos sin habilidades de programación de computadoras que les resulta fácil de usar. Su popularidad se debe al uso cada vez mayor de la minería de datos para varios objetivos, como establecer precios de anuncios, encontrar nuevos medicamentos más rápidamente o ajustar los modelos financieros. R tiene una amplia variedad de paquetes para minería de datos.
Estadísticas con SPSS Software de Análisis Predictivo
14 HorasGoal:
Aprender a trabajar con SPSS a nivel de independencia
Los destinatarios:
Analistas, investigadores, científicos, estudiantes y todos aquellos que quieran adquirir la capacidad de utilizar el paquete SPSS y aprender técnicas populares de minería de datos.
Introducción a la visualización de datos con Tidyverse y R
7 HorasPúblico objetivo
Formato del curso
Al final de esta formación, los participantes podrán:
En este entrenamiento interactivo y en vivo, los participantes aprenderán a manipular y visualizar datos utilizando las herramientas incluidas en el Tidyverse.
El Tidyverse es una colección de paquetes versátiles de R para limpiar, procesar, modelar y visualizar datos. Algunos de los paquetes incluidos son: ggplot2, dplyr, tidyr, readr, purrr y tibble.
- Principiantes en el lenguaje R
- Principiantes en el análisis de datos y visualización de datos
- Parte teórica, parte discusión, ejercicios y práctica intensiva
- Realizar análisis de datos y crear visualizaciones atractivas
- Sacar conclusiones útiles de diversos conjuntos de datos de muestra
- Filtrar, ordenar y resumir datos para responder preguntas exploratorias
- Convertir datos procesados en gráficos informativos como líneas, barras, histogramas
- Importar y filtrar datos de diversas fuentes de datos, incluyendo Excel, CSV y archivos SPSS