Curso de Web Scraping with Python
El Web Scraping es una técnica para extraer datos de un sitio web y luego guardarlos en un archivo o base de datos local.
Esta capacitación en vivo dirigida por un instructor (en línea o presencial) está dirigida a desarrolladores que desean utilizar Python para automatizar el proceso de rastreo de muchos sitios web para extraer datos para su procesamiento y análisis.
Al final de esta formación, los participantes serán capaces de:
- Instalar y configurar Python y todos los paquetes relevantes.
- Recuperar y analizar datos almacenados en muchos sitios web.
- Comprender cómo funcionan los sitios web y cómo está estructurado su HTML.
- Construir arañas para rastrear la web a gran escala.
- Utilizar Selenium para rastrear páginas web impulsadas por AJAX.
Formato del curso
- Conferencia interactiva y discusión.
- Muchos ejercicios y prácticas.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Este curso asume conocimientos de programación.
- Para solicitar una formación personalizada para este curso, por favor contáctenos para organizarlo.
Programa del Curso
Introducción
Configuración del entorno de desarrollo
Python Cartilla: Estructuras de Datos, Condicionales, Manejo de Archivos, etc.
Python Paquetes para Web Scraping: Scrapy y BeautifulSoup
Cómo funciona un sitio web
Cómo se estructura HTML
Hacer una solicitud web
Raspado de una página HTML
Trabajar con XPath y CSS
Filtrado de datos mediante iones Express regulares
Creación de un rastreador web
Rastreo de páginas AJAX y JavaScript con Selenium.
Mejores prácticas de Web Scraping
Solución de problemas
Resumen y conclusión
Requerimientos
- Programming experiencia, preferiblemente en Python. Si los participantes tienen experiencia en programación en un lenguaje distinto a Python, la capacitación puede extenderse para incluir más ejercicios introductorios de Python.
Audiencia
- Desarrolladores
Los cursos de formación abiertos requieren más de 5 participantes.
Curso de Web Scraping with Python - Booking
Curso de Web Scraping with Python - Enquiry
Web Scraping with Python - Consulta de consultoría
Consulta de consultoría
Testimonios (1)
Muchos ejemplos y temas diferentes han sido cubiertos, desde investigaciones básicas hasta la gestión de inicio de sesión y la administración de páginas dinámicas.
Daniele Tagliaferro - Creditsafe Italia Srl
Curso - Web Scraping with Python
Traducción Automática
Próximos cursos
Cursos Relacionados
Compórtate: BDD con Python (Pepino / pepinillo para Python)
7 HorasThis instructor-led, live training in Colombia begins with a discussion of BDD and how the Behave framework can be used to carry out BDD testing for web applications. Participants are given ample opportunity to interact with the instructor and peers while implementing the concepts and tactics learned in this hands-on, practice-based lab environment.
Al final de esta capacitación, los participantes tendrán una comprensión firme de BDD y Behave, así como la práctica necesaria para implementar estas técnicas y herramientas en escenarios de prueba del mundo real.
Scaling Data Analysis with Python and Dask
14 HorasEsta capacitación en vivo dirigida por un instructor en Colombia (en línea o en el sitio) está dirigida a científicos de datos e ingenieros de software que deseen usar Dask con el ecosistema Python para crear, escalar y analizar grandes conjuntos de datos.
Al final de esta capacitación, los participantes serán capaces de:
- Configure el entorno para comenzar a crear procesamiento de big data con Dask y Python.
- Explora las funciones, bibliotecas, herramientas y API disponibles en Dask.
- Comprenda cómo Dask acelera la computación paralela en Python.
- Aprenda a escalar el ecosistema de Python (Numpy, SciPy y Pandas) usando Dask.
- Optimice el entorno de Dask para mantener un alto rendimiento en el manejo de grandes conjuntos de datos.
Análisis de Datos en Python Usando Pandas y Numpy
14 HorasThis instructor-led, live training in Colombia (online or onsite) is aimed at intermediate-level Python developers and data analysts who wish to enhance their skills in data analysis and manipulation using Pandas and NumPy.
By the end of this training, participants will be able to:
- Set up a development environment that includes Python, Pandas, and NumPy.
- Create a data analysis application using Pandas and NumPy.
- Perform advanced data wrangling, sorting, and filtering operations.
- Conduct aggregate operations and analyze time series data.
- Visualize data using Matplotlib and other visualization libraries.
- Debug and optimize their data analysis code.
FARM (FastAPI, React, and MongoDB) Full Stack Development
14 HorasEsta capacitación en vivo dirigida por un instructor (en línea o presencial) está dirigida a desarrolladores que desean utilizar la pila FARM (FastAPI, React y MongoDB) para crear aplicaciones web dinámicas, de alto rendimiento y escalables.
Al final de esta formación, los participantes serán capaces de:
- Configure el entorno de desarrollo necesario que integre FastAPI, React y MongoDB.
- Comprenda los conceptos clave, las características y los beneficios de la pila FARM.
- Aprenda a crear API REST con FastAPI.
- Aprenda a diseñar aplicaciones interactivas con React.
- Desarrolle, pruebe e implemente aplicaciones (front-end y back-end) mediante la pila FARM.
Developing APIs with Python and FastAPI
14 HorasEsta capacitación en vivo dirigida por un instructor en Colombia (en línea o presencial) está dirigida a desarrolladores que desean usar FastAPI con Python para crear, probar e implementar API RESTful de manera más fácil y rápida.
Al final de esta formación, los participantes serán capaces de:
- Configurar el entorno de desarrollo necesario para desarrollar APIs con Python y FastAPI.
- Crear APIs de forma más rápida y sencilla utilizando la biblioteca FastAPI.
- Aprender a crear modelos de datos y esquemas basados en Pydantic y OpenAPI.
- Conectar APIs a una base de datos utilizando SQLAlchemy.
- Implementar seguridad y autenticación en APIs utilizando las herramientas de FastAPI.
- Crear imágenes de contenedor e implementar APIs web en un servidor en la nube.
Fundamentos de Aprendizaje Automático con Python
14 HorasEl objetivo de este curso es proporcionar una competencia básica en la aplicación de métodos Machine Learning en la práctica. A través del uso del lenguaje de programación Python y sus diversas bibliotecas, y basado en una multitud de ejemplos prácticos, este curso enseña cómo usar los bloques de construcción más importantes de Machine Learning, cómo tomar decisiones de modelado de datos, interpretar las salidas de los algoritmos y validar los resultados.
Nuestro objetivo es brindarle las habilidades para comprender y usar las herramientas más fundamentales de la caja de herramientas Machine Learning con confianza y evitar las trampas comunes de las aplicaciones de Data Science.
Machine Learning with Python – 4 Days
28 Horasel objetivo de este curso es proporcionar una competencia general en la aplicación de métodos de aprendizaje automático en la práctica. Mediante el uso del lenguaje de programación Python y sus diversas bibliotecas, y basado en una multitud de ejemplos prácticos, este curso enseña cómo utilizar los bloques de construcción más importantes del aprendizaje automático, cómo tomar decisiones de modelado de datos, interpretar el las salidas de los algoritmos y validar los resultados.
nuestro objetivo es darle las habilidades para entender y utilizar las herramientas más fundamentales de la caja de herramientas machine learning con confianza y evitar las trampas comunes de las aplicaciones de Ciencias de la información.
Accelerating Python Pandas Workflows with Modin
14 HorasEsta capacitación en vivo dirigida por un instructor en Colombia (en línea o presencial) está dirigida a científicos de datos y desarrolladores que desean usar Modin para crear e implementar cálculos paralelos con Pandas para un análisis de datos más rápido.
Al final de esta formación, los participantes serán capaces de:
- Configure el entorno necesario para comenzar a desarrollar Pandas flujos de trabajo a escala con Modin.
- Comprender las características, la arquitectura y las ventajas de Modin.
- Conoce las diferencias entre Modin, Dask y Ray.
- Realice Pandas operaciones más rápido con Modin.
- Implemente toda la API Pandas y las funciones.
Python para la Generación de Lenguaje Natural
21 HorasIn this instructor-led, live training in Colombia, participants will learn how to use Python to produce high-quality natural language text by building their own NLG system from scratch. Case studies will also be examined and the relevant concepts will be applied to live lab projects for generating content.
By the end of this training, participants will be able to:
- Use NLG to automatically generate content for various industries, from journalism, to real estate, to weather and sports reporting.
- Select and organize source content, plan sentences, and prepare a system for automatic generation of original content.
- Understand the NLG pipeline and apply the right techniques at each stage.
- Understand the architecture of a Natural Language Generation (NLG) system.
- Implement the most suitable algorithms and models for analysis and ordering.
- Pull data from publicly available data sources as well as curated databases to use as material for generated text.
- Replace manual and laborious writing processes with computer-generated, automated content creation.
Prueba unitaria con Python
21 HorasEn esta capacitación en vivo dirigida por un instructor en Colombia, los participantes aprenderán a usar PyTest para escribir pruebas cortas y fáciles de mantener que sean elegantes, expresivas y legibles.
Al final de esta capacitación, los participantes serán capaces de:
- Escriba pruebas legibles y fáciles de mantener sin necesidad de código repetitivo.
- Utilice el modelo de accesorios para escribir pequeñas pruebas.
- Escale las pruebas hasta realizar pruebas funcionales complejas para aplicaciones, paquetes y bibliotecas.
- Comprenda y aplique las características de PyTest, como los ganchos, la reescritura de aserciones y los complementos.
- Reduzca los tiempos de prueba ejecutando pruebas en paralelo y en varios procesadores.
- Ejecute pruebas en un entorno de integración continua, junto con otras utilidades como tox, mock, coverage, unittest, doctest y Selenium.
- Utilice Python para probar aplicaciones que no sean de Python.
Python para el Aprendizaje Automático Avanzado
21 HorasEn esta capacitación en vivo dirigida por un instructor en Colombia, los participantes aprenderán las técnicas de aprendizaje automático más relevantes y de vanguardia en Python mientras crean una serie de aplicaciones de demostración que involucran imágenes, música, texto y datos financieros.
Al final de esta formación, los participantes serán capaces de:
- Implemente algoritmos y técnicas de aprendizaje automático para resolver problemas complejos.
- Aplique el aprendizaje profundo y el aprendizaje semisupervisado a aplicaciones que involucran imágenes, música, texto y datos financieros.
- Lleve los algoritmos Python a su máximo potencial.
- Utilice bibliotecas y paquetes como NumPy y Theano.
Python: automatiza las cosas aburridas
14 HorasEsta capacitación en vivo dirigida por un instructor en Colombia se basa en el popular libro "Automate the Boring Stuff with Python", de Al Sweigart. Está dirigido a principiantes y cubre conceptos esenciales Python de programación a través de ejercicios prácticos y discusiones. La atención se centra en aprender a escribir código para aumentar drásticamente la productividad de la oficina.
Al final de esta formación, los participantes sabrán cómo programar en Python y aplicar esta nueva habilidad para:
- Automatizar tareas escribiendo simples programas en Python.
- Escribir programas que puedan reconocer patrones de texto con "expresiones regulares".
- Generar y actualizar hojas de cálculo Excel de forma programática.
- Analizar archivos PDF y documentos Word.
- Explorar sitios web y extraer información de fuentes en línea.
- Escribir programas que envíen notificaciones por correo electrónico.
- Utilizar las herramientas de depuración de Python para resolver errores rápidamente.
- Controlar el ratón y el teclado de forma programática para hacer clics y escribir por usted.
Python Avanzado
28 HorasEn esta capacitación en vivo dirigida por un instructor en Colombia, los participantes aprenderán técnicas avanzadas de programación Python, incluida la forma de aplicar este lenguaje versátil para resolver problemas en áreas como aplicaciones distribuidas, análisis y visualización de datos, programación de interfaz de usuario y secuencias de comandos de mantenimiento.
Programación Python
28 HorasEste curso está diseñado para aquellos que desean aprender el lenguaje de programación Python. El énfasis está en el lenguaje Python, las bibliotecas centrales, así como en la selección de las mejores y más útiles bibliotecas desarrolladas por la comunidad Python. Python impulsa empresas y es utilizado por científicos de todo el mundo: es uno de los lenguajes de programación más populares.
El curso puede impartirse utilizando la última versión de Python 3.x con ejercicios prácticos que aprovechan toda su potencia. Este curso puede impartirse en cualquier sistema operativo (todas las variantes de UNIX, incluyendo Linux y Mac OS X, así como Microsoft Windows).
Los ejercicios prácticos constituyen alrededor del 70% del tiempo del curso, y alrededor del 30% son demostraciones y presentaciones. Se pueden hacer discusiones y preguntas a lo largo del curso.
Nota: la formación se puede adaptar a las necesidades específicas previa solicitud antes de la fecha propuesta del curso.
Selenium with Python for test automation
14 HorasEn esta capacitación en vivo dirigida por un instructor en Colombia los participantes combinan el poder de Python con Selenium para automatizar las pruebas de una aplicación web de muestra. Al combinar la teoría con la práctica en un entorno de laboratorio en vivo, los participantes obtendrán el conocimiento y la práctica necesarios para automatizar sus propios proyectos de pruebas web utilizando Python y Selenium.