SCRAPY en producción

Demo del Meetup de Python Madrid:

DevOps y Scraping en el ecosistema Python

https://www.meetup.com/python-madrid/events/244901807/

Para ejecutar el proyecto:

pip install -r requirements.txt
scrapy crawl idealista

Parámetros del spider

neighborhoods: Barrio o lista de barrios separados por comas que se quieren analizar.

Pipelines

clean.CleanItems

Para cada item, añade:

Country Code
El precio en float
Numero de habitaciones en Float
Currency (USD o EUR)

prices.AddUSDToItems

Añade el precio en USD

stats.AddItemStats

Cachea información para generar las estadísticas.

Middlewares

useragent.RotateUserAgentMiddleware

Añade a la request un user agent de manera random con la posibilidad de elegir entre una lista de Desktop y Mobile.

customheader.AddCustomHeaderMiddleware

Añade otro header a la request.

Extensions

statistics.StatsExtension

Cuando el spider termina, se genera una señal "spider_closed".

En ese momento, se generan 4 estadísticas:

Media de habitaciones
Media de precio
Media de metros cuadrados
Precio medio por metro cuadrado

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
demo		demo
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SCRAPY en producción

DevOps y Scraping en el ecosistema Python

Parámetros del spider

Pipelines

clean.CleanItems

prices.AddUSDToItems

stats.AddItemStats

Middlewares

useragent.RotateUserAgentMiddleware

customheader.AddCustomHeaderMiddleware

Extensions

statistics.StatsExtension

About

Releases

Packages

Contributors 2

Languages

mongonauta/python-madrid-scrapy

Folders and files

Latest commit

History

Repository files navigation

SCRAPY en producción

DevOps y Scraping en el ecosistema Python

Parámetros del spider

Pipelines

clean.CleanItems

prices.AddUSDToItems

stats.AddItemStats

Middlewares

useragent.RotateUserAgentMiddleware

customheader.AddCustomHeaderMiddleware

Extensions

statistics.StatsExtension

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages