Skip to content

Commit

Permalink
Update README.md
Browse files Browse the repository at this point in the history
  • Loading branch information
lanbing510 authored Mar 26, 2017
1 parent 4ed4bf3 commit 1d33774
Showing 1 changed file with 6 additions and 6 deletions.
12 changes: 6 additions & 6 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,9 +1,9 @@
##豆瓣读书爬虫
## 豆瓣读书爬虫

Python所写,豆瓣读书的爬虫,方便大家搜罗各种美美书!


###更新
### 更新

最近爬下了豆瓣所有的图书信息(3088633本,2138386KB),并做了一个界面方面与数据库交互来搜罗好书。 注:这里的代码不是爬下所有书籍所用的代码,仅供参考。有机会的时候再公开代码和爬下的所有数据。

Expand All @@ -17,13 +17,13 @@ Python所写,豆瓣读书的爬虫,方便大家搜罗各种美美书!
![Aaron Swartz](https://github.com/lanbing510/DouBanSpider/raw/master/screenshots/result.jpg)


###更新
### 更新

最近爬书发现豆瓣的页面规则发生了变化,导致不能爬到评价人数,由此对代码进行了相应的更新,并爬了一些新的数据。
最近爬书发现豆瓣的页面规则发生了变化,导致不能爬到评价人数,由此对代码进行了相应的更新,并爬了一些新的数据(并不全)



###实现功能
### 实现功能

1 可以爬下豆瓣读书标签下的所有图书

Expand All @@ -33,7 +33,7 @@ Python所写,豆瓣读书的爬虫,方便大家搜罗各种美美书!

4 采用User Agent伪装为浏览器进行爬取,并加入随机延时来更好的模仿浏览器行为,避免爬虫被封(更新于 2015-5-20)

###效果截图
### 效果截图

试着小小运行了下,爬了七八万本书,结果在book_list.xlsx中,截图如下:

Expand Down

0 comments on commit 1d33774

Please sign in to comment.