Introducción a la Ciencia de Datos
Este curso de formación en vivo dirigido por un instructor (tanto en línea como presencial) está diseñado para profesionales que desean iniciar una carrera en Ciencia de Datos.
Al finalizar esta formación, los participantes serán capaces de:
- Instalar y configurar Python y MySql.
- Comprender qué es la Ciencia de Datos y cómo puede aportar valor a prácticamente cualquier negocio.
- Aprender los fundamentos de la programación en Python.
- Aprender técnicas de Aprendizaje Automático supervisado y no supervisado, así como cómo implementarlas e interpretar sus resultados.
Formato del Curso
- Conferencia interactiva y discusión.
- Muchos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para hacer los arreglos necesarios.
Temario del curso
Día 1
- Ciencia de Datos: una visión general
- Parte práctica: Comencemos con Python - Características básicas del lenguaje
- Ciclo de vida de la ciencia de datos - parte 1
- Parte práctica: Trabajando con datos estructurados - la biblioteca Pandas
Día 2
- Ciclo de vida de la ciencia de datos - parte 2
- Parte práctica: Trabajando con datos reales
- Visualización de datos
- Parte práctica: La biblioteca Matplotlib
Día 3
- SQL - parte 1
- Parte práctica: Creando una base de datos MySql con tablas, insertando datos y realizando consultas simples
- SQL - parte 2
- Parte práctica: Integrando MySql y Python
Día 4
- Aprendizaje supervisado - parte 1
- Parte práctica: Regresión
- Aprendizaje supervisado - parte 2
- Parte práctica: Clasificación
Día 5
- Aprendizaje supervisado - parte 3
- Parte práctica: Creando un filtro de spam
- Aprendizaje no supervisado
- Parte práctica: Agrupación de imágenes con k-means
Requerimientos
- Comprender las matemáticas y la estadística.
- Alguna experiencia en programación, preferiblemente en Python.
Audiencia
- Profesionales interesados en cambiar de carrera
- Gente curiosa sobre Ciencia de Datos y Análisis de Datos
Los cursos públicos requieren más de 5 participantes.
Introducción a la Ciencia de Datos - Reserva
Introducción a la Ciencia de Datos - Consulta
Introducción a la Ciencia de Datos - Solicitud de consultoría
Testimonios (1)
Los ejercicios prácticos relacionados con el contenido realmente ayudan a comprender más sobre cada tema. Además, el estilo de comenzar la clase con una conferencia y continuar con ejercicios prácticos es bueno y útil para relacionarlo con la conferencia presentada anteriormente.
Nazeera Mohamad - Ministry of Science, Technology and Innovation
Curso - Introduction to Data Science and AI using Python
Traducción Automática
Próximos cursos
Cursos Relacionados
Introducción a la Ciencia de Datos y la Inteligencia Artificial usando Python
35 HorasEste es un curso introductorio de 5 días dedicado a la Ciencia de Datos y la Inteligencia Artificial (IA).
El curso incluye ejemplos y ejercicios prácticos utilizando Python.
Apache Airflow para Data Science: Automatización de Pipelines
21 HorasEste curso de formación dirigido por un instructor en Colombia (en línea o presencial) está orientado a participantes de nivel intermedio que desean automatizar y gestionar flujos de trabajo de aprendizaje automático, incluyendo el entrenamiento, la validación y el despliegue de modelos utilizando Apache Airflow.
Al final de este curso, los participantes serán capaces de:
- Configurar Apache Airflow para la orquestación de flujos de trabajo de aprendizaje automático.
- Automatizar tareas de preprocesamiento de datos, entrenamiento y validación de modelos.
- Integrar Airflow con marcos y herramientas de aprendizaje automático.
- Desplegar modelos de aprendizaje automático utilizando pipelines automatizados.
- Monitorear y optimizar flujos de trabajo de aprendizaje automático en producción.
Anaconda Ecosistema para Científicos de Datos
14 HorasEsta capacitación en vivo dirigida por un instructor en Colombia (en línea o presencial) está dirigida a científicos de datos que desean utilizar el ecosistema Anaconda para capturar, administrar e implementar paquetes y flujos de trabajo de análisis de datos en una sola plataforma.
Al final de esta formación, los participantes serán capaces de:
- Instale y configure Anaconda componentes y bibliotecas.
- Comprender los conceptos básicos, las características y los beneficios de Anaconda.
- Administre paquetes, entornos y canales con Anaconda Navigator.
- Utilice los paquetes Conda, R y Python para la ciencia de datos y el aprendizaje automático.
- Conozca algunos casos de uso prácticos y técnicas para la gestión de múltiples entornos de datos.
AWS Cloud9 para Data Science
28 HorasEste curso dirigido por un instructor y en vivo en Colombia (en línea o presencial) está destinado a científicos de datos y analistas de nivel intermedio que deseen utilizar AWS Cloud9 para flujos de trabajo de ciencia de datos optimizados.
Al finalizar este curso, los participantes podrán:
- Configurar un entorno de ciencia de datos en AWS Cloud9.
- Realizar análisis de datos utilizando Python, R y Jupyter Notebook en Cloud9.
- Integrar AWS Cloud9 con servicios de datos de AWS como S3, RDS y Redshift.
- Utilizar AWS Cloud9 para el desarrollo y despliegue de modelos de aprendizaje automático.
- Optimizar flujos de trabajo basados en la nube para análisis y procesamiento de datos.
Introducción a Google Colab para Ciencia de Datos
14 HorasEste entrenamiento guiado por instructores (en línea o presencial) en Colombia está dirigido a científicos de datos principiantes y profesionales de TI que desean aprender los fundamentos de la ciencia de datos utilizando Google Colab.
Al final de este curso, los participantes podrán:
- Configurar y navegar en Google Colab.
- Escribir y ejecutar código Python básico.
- Importar y manejar conjuntos de datos.
- Crear visualizaciones utilizando bibliotecas de Python.
Una Introducción Práctica a la Ciencia de Datos
35 HorasLos asistentes que completen este programa de capacitación obtendrán una comprensión práctica y basada en la realidad del mundo sobre la Ciencia de Datos, así como de las tecnologías, metodologías y herramientas asociadas.
Tendrán la oportunidad de aplicar este conocimiento a través de ejercicios prácticos. La interacción grupal y los comentarios del instructor son componentes esenciales de la clase.
El curso comienza con una introducción a los conceptos fundamentales de la Ciencia de Datos, para luego avanzar hacia las herramientas y metodologías utilizadas en este campo.
Audiencia
- Desarrolladores
- Analistas técnicos
- Consultores de TI
Formato del Curso
- Parte teórica, parte discusión, ejercicios y práctica intensiva
Nota
- Para solicitar un entrenamiento personalizado para este curso, por favor contáctenos para coordinar.
Ciencia de Datos para Big Data Analytics
35 HorasEl big data se refiere a conjuntos de datos tan extensos y complejos que las herramientas de procesamiento de datos convencionales no son suficientes para gestionarlos. Entre los desafíos del big data destacan la captura, el almacenamiento, el análisis, la búsqueda, el intercambio, la transferencia, la visualización, las consultas, la actualización y la protección de la información.
Data Science essential for para los profesionales de marketing / ventas
21 HorasEste curso está diseñado para profesionales de marketing y ventas que buscan profundizar en la aplicación de la ciencia de datos en sus respectivos campos. El curso ofrece una cobertura exhaustiva de las diferentes técnicas de ciencia de datos utilizadas para aumentar las ventas (upsale), ofrecer productos complementarios (cross-sale), segmentar el mercado, fortalecer marcas y calcular el valor del cliente a lo largo de su vida útil (CLV).
Diferencias entre marketing y ventas: ¿Cómo se distinguen las ventas del marketing? En términos sencillos,
las ventas pueden considerarse como un proceso que se enfoca en individuos o grupos pequeños, mientras que el marketing apunta a un grupo más amplio o al público en general. El marketing abarca la investigación (identificación de las necesidades del cliente), el desarrollo de productos innovadores y la promoción del producto (a través de anuncios) para crear conciencia sobre este entre los consumidores. En resumen, el marketing se encarga de generar clientes potenciales o prospectos. Una vez que el producto está en el mercado, es responsabilidad del vendedor persuadir al cliente para que lo compre.
Mientras que el marketing tiene una perspectiva a largo plazo y busca crear un nombre para la marca y convencer al cliente de comprar, aunque no necesite el producto, las ventas se centran en objetivos a corto plazo para identificar al consumidor objetivo. En concepto, también hay diferencias significativas: las ventas se enfocan en alinear la demanda del consumidor con los productos disponibles, mientras que el marketing busca satisfacer las necesidades y deseos de los consumidores.
El marketing puede considerarse como un paso previo a las ventas. Prepara el terreno para que un vendedor pueda acercarse a un consumidor. Utiliza diversos métodos como publicidad, marketing de marca, relaciones públicas, correo directo y marketing viral para crear conciencia sobre el producto. Por su parte, las ventas dependen en gran medida de interacciones personales, incluyendo reuniones uno a uno, networking y llamadas.
Otra diferencia notable entre marketing y ventas es que el primero involucra tanto análisis micro como macro, centrados en estrategias a largo plazo. En cambio, las ventas se centran en los desafíos diarios y las relaciones con el cliente.
Jupyter para Equipos de Ciencia de Datos
7 HorasEsta capacitación en vivo dirigida por un instructor en Colombia (en línea o presencial) presenta la idea del desarrollo colaborativo en ciencia de datos y demuestra cómo usar Jupyter para rastrear y participar como equipo en el "ciclo de vida de una idea computacional". Guía a los participantes a través de la creación de un proyecto de ciencia de datos de muestra basado en el ecosistema de Jupyter.
Al final de esta formación, los participantes serán capaces de:
- Instale y configure Jupyter, incluida la creación e integración de un repositorio de equipo en Git.
- Utilice las funciones de Jupyter, como extensiones, widgets interactivos, modo multiusuario, etc., para habilitar la colaboración en proyectos.
- Cree, comparta y organice Jupyter Notebooks con los miembros del equipo.
- Elija entre Scala, Python, R, para escribir y ejecutar código en sistemas de big data como Apache Spark, todo a través de la interfaz de Jupyter.
Kaggle
14 HorasEsta capacitación en vivo dirigida por un instructor en Colombia (en línea o presencial) está dirigida a científicos de datos y desarrolladores que desean aprender y desarrollar sus carreras en Data Science utilizando Kaggle.
Al final de esta formación, los participantes serán capaces de:
- Más información sobre la ciencia de datos y el aprendizaje automático.
- Explora el análisis de datos.
- Obtenga más información sobre Kaggle y cómo funciona.
Data Science con la Plataforma de Análisis KNIME
21 HorasLa Plataforma de Análisis KNIME es una solución líder de código abierto para la innovación basada en datos. Esta plataforma te ayuda a descubrir el potencial oculto en tus datos, obtener nuevas perspectivas o predecir futuros posibles. Con más de 1000 módulos, cientos de ejemplos listos para ejecutar, una amplia gama de herramientas integradas y la mayor variedad de algoritmos avanzados disponibles, KNIME es la caja de herramientas ideal para cualquier científico de datos y analista de negocios.
Este curso sobre la Plataforma de Análisis KNIME es una excelente oportunidad tanto para principiantes como para usuarios avanzados y expertos en KNIME. Te permitirá familiarizarte con KNIME, aprender a utilizarla de manera más efectiva y crear informes claros y completos basados en flujos de trabajo de KNIME.
Este entrenamiento dirigido por un instructor (ya sea en línea o presencial) está diseñado para profesionales de datos que deseen usar KNIME para resolver necesidades empresariales complejas.
Está orientado a una audiencia sin conocimientos previos de programación y que busca utilizar herramientas de vanguardia para implementar escenarios analíticos.
Al finalizar este entrenamiento, los participantes serán capaces de:
- Instalar y configurar KNIME.
- Construir escenarios de ciencia de datos.
- Entrenar, probar y validar modelos.
- Implementar la cadena de valor completa de los modelos de ciencia de datos.
Formato del Curso
- Conferencia interactiva y discusión.
- Muchos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso o para obtener más información sobre el programa, por favor contáctenos para hacer los arreglos necesarios.
Fundamentos de MATLAB, Ciencia de datos y generación de informes
35 HorasEn la primera parte de esta capacitación, exploramos los fundamentos de MATLAB y su papel como lenguaje y plataforma. Esta sección incluye una introducción a la sintaxis de MATLAB, el manejo de matrices y arreglos, la visualización de datos, el desarrollo de scripts y los principios de programación orientada a objetos.
En la segunda parte, ilustramos cómo utilizar MATLAB para minería de datos, aprendizaje automático y análisis predictivo. Para ofrecer una perspectiva clara y práctica del enfoque y potencia de MATLAB, realizamos comparaciones con otras herramientas como hojas de cálculo, C, C++ y Visual Basic.
En la tercera parte de la formación, los participantes aprenden a optimizar su trabajo automatizando el procesamiento de datos y la generación de informes.
A lo largo del curso, los participantes aplicarán los conceptos aprendidos mediante ejercicios prácticos en un entorno de laboratorio. Al final de la capacitación, tendrán una comprensión profunda de las capacidades de MATLAB y podrán emplearlas para resolver problemas de ciencia de datos reales, así como para optimizar su trabajo a través de la automatización.
Se realizarán evaluaciones durante el curso para medir el progreso.
Formato del curso
- El curso combina ejercicios teóricos y prácticos, incluyendo discusiones de casos, revisión de código de muestra e implementación práctica.
Nota
- Las sesiones de práctica se basarán en plantillas de informes de datos preestablecidas. Si tiene requisitos específicos, no dude en contactarnos para organizarlo.
Aprendizaje Automático - Ciencia de Datos
21 HorasEste curso de formación presencial dirigido por un instructor en Colombia (en línea o en las instalaciones del cliente) está destinado a analistas de datos intermedios, desarrolladores o aspirantes a científicos de datos que deseen aplicar técnicas de aprendizaje automático en Python para extraer conocimientos, hacer predicciones y automatizar decisiones basadas en datos.
Al final de este curso, los participantes podrán:
- Comprender y diferenciar las principales paradigmas del aprendizaje automático.
- Explorar técnicas de preprocesamiento de datos y métricas de evaluación de modelos.
- Aplicar algoritmos de aprendizaje automático para resolver problemas de datos en el mundo real.
- Utilizar bibliotecas de Python y cuadernos Jupyter para el desarrollo práctico.
- Construir modelos para predicción, clasificación, recomendación y clustering.
Acelerando los Flujos de Trabajo de Python Pandas con Modin
14 HorasEsta capacitación en vivo dirigida por un instructor en Colombia (en línea o presencial) está dirigida a científicos de datos y desarrolladores que desean usar Modin para crear e implementar cálculos paralelos con Pandas para un análisis de datos más rápido.
Al final de esta formación, los participantes serán capaces de:
- Configure el entorno necesario para comenzar a desarrollar Pandas flujos de trabajo a escala con Modin.
- Comprender las características, la arquitectura y las ventajas de Modin.
- Conoce las diferencias entre Modin, Dask y Ray.
- Realice Pandas operaciones más rápido con Modin.
- Implemente toda la API Pandas y las funciones.
Ciencia de Datos con GPU usando NVIDIA RAPIDS
14 HorasEste curso de formación dirigido por un instructor en Colombia (en línea o presencial) está destinado a científicos de datos y desarrolladores que deseen utilizar RAPIDS para crear pipelines, flujos de trabajo y visualizaciones aceleradas por GPU, aplicando algoritmos de aprendizaje automático como XGBoost, cuML, etc.
Al final de este curso, los participantes podrán:
- Configurar el entorno de desarrollo necesario para construir modelos de datos con NVIDIA RAPIDS.
- Comprender las características, componentes y ventajas de RAPIDS.
- Aprovechar GPUs para acelerar pipelines de datos y análisis de extremo a extremo.
- Implementar la preparación de datos y ETL acelerados por GPU con cuDF y Apache Arrow.
- Aprender a realizar tareas de aprendizaje automático con los algoritmos XGBoost y cuML.
- Crear visualizaciones de datos y ejecutar análisis de grafos con cuXfilter y cuGraph.