声明:此爬虫仅用于学习、研究用途,请不要用于非法用途。任何由此引发的法律纠纷自行负责。
该代码爬取摩拜单车的微信小程序接口,以便用于共享单车的分析。 相关文章:
如果你喜欢我的文章,请赏一杯咖啡或者Star,谢谢:)
目录结构:
- \analysis - jupyter做数据分析
- \influx-importer - 导入到influxdb,但之前没怎么弄好
- \modules - 代理模块
- \web - 实时图形化显示模块,当时只是为了学一下react而已,效果请见这里(注:服务端已经关闭,无法正常查看)
- crawler.py - 爬虫核心代码
- importToDb.py - 导入到postgres数据库中进行分析
- sql.sql - 创建表的sql
- start.sh - 持续运行的脚本
使用前请更新代理池,我这里仅仅提供的是一个样例,里面的代理很有可能已经失效:
r = requests.get("https://jsonblob.com/api/jsonBlob/31bf2dc8-00e6-11e7-a0ba-e39b7fdbe78b", timeout=10)
requires:
python3
pip requires:
numpy
ujson (which is never used)
ujson
is removed by @zxj5470 and he changed it into stdlibjson
,and update theujson.decode
byjson.loads