Skip to content

bxb0911/DouBanSpider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 

Repository files navigation

Python所写,豆瓣读书的爬虫,方便大家搜罗各种美美书

实现功能:

1 可以爬下豆瓣读书标签下的所有图书

2 按评分排名依次存储

3 依据不同的主题存储到Excel不同的Sheet,也可方便大家筛选搜罗,比如筛选评价人数>2000的好书

4 加入了User Agent来模仿浏览器行为进行爬取,防止出现Forbidden403等封锁IP的情况 (更新于 2015-5-20)

代码刚写一小时,更多功能有待增加

声明:受@plough同学启发,再其代码基础上进行的创作,感谢@plough

About

豆瓣读书的爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%