Sie sind auf Seite 1von 1

CURSO DE WEB SCRAPING

V1. Introducción al Web Scraping en Python

1. Introducción
2. Scraping de una página (Spider)
3. Scraping de varias páginas (CrawlSpider)

Extraer información de la web por encargo:

- Extraer ítems

Se pueden extraer mediante un API.


Si no tenemos el API debemos hacer Scraping.

Web Scraping (raspar en la web): es extraer información de forma automática de las páginas web
del internet.

Ventajas al hacer Web Scraping:

- No se depende de una api


- No hay limitaciones

Desventajas:

- Dependemos de la estructura de la página a la cual se va hacer scraping

Pasos para hacer el Scraping:

1. Tener una URL (semilla)


2. Requests (se realizan requerimientos a esta URL)
3. Response (se obtiene una respuesta en HTML de esta URL)
4. Populate Ítems (se obtiene la información que deseo de la respuesta)
5. More URLs (ir a mas URLs a partir de esta URL semilla)

Das könnte Ihnen auch gefallen