jandan_spider

使用selenium爬取煎蛋妹纸图片(Python3)

这里是一个简单的例子，使用类似的套路可以处理大量此类网站，希望对爬虫新手有一点借鉴作用。

在脚本中输入煎蛋妹子首页网址'https://jandan.net/ooxx'，脚本将自动补全网址，并下载煎蛋妹子全站图片。

之所以使用selenium是因为，煎蛋妹子原始图片url不出现在网页原始代码中，但可在chrome开发者工具中的Elements选项卡中查看，而webdriver.Chrome().get(url_base)可以轻松获取这些url。

测试前请安装好selenium，并在spider_jandan.py当前路径新建img文件夹

/root
    /img
    chromedriver.exe
    spider_jandan.py
    README.md

然后执行python spider_jandan.py，所有图片将保存在img文件夹中。

我使用如下pakage版本测试通过： selenium (3.11.0) requests (2.18.4)

此处感谢，抓取煎蛋妹子的创意完全来自kulovecc同学: https://github.com/kulovecc/jandan_spider

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
LICENSE		LICENSE
README.md		README.md
chromedriver.exe		chromedriver.exe
jandan_spider.py		jandan_spider.py

Provide feedback