Skip to content

note4me/mobike-crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

摩拜单车爬虫

声明:此爬虫仅用于学习、研究用途,请不要用于非法用途。任何由此引发的法律纠纷自行负责。

2017-5-16:现在如果没有登录也可以得到真实的数据,但是比登陆后的数据少一些,一般只会返回少于5个。可以在手机上和微信小程序上进行验证。登陆后可以获得完整的数据,爬下来的数据才是可用的。

对登录感兴趣的,可以参考login分支。

该代码爬取摩拜单车的微信小程序接口,以便用于共享单车的分析。 相关文章:

如果你喜欢我的文章,请赏一杯咖啡或者Star,谢谢:)

目录结构:

  • \analysis - jupyter做数据分析
  • \influx-importer - 导入到influxdb,但之前没怎么弄好
  • \modules - 代理模块
  • \web - 实时图形化显示模块,当时只是为了学一下react而已,效果请见这里(注:服务端已经关闭,无法正常查看)
  • crawler.py - 爬虫核心代码
  • importToDb.py - 导入到postgres数据库中进行分析
  • sql.sql - 创建表的sql
  • start.sh - 持续运行的脚本

使用前请更新代理池,我这里仅仅提供的是一个样例,里面的代理很有可能已经失效:

r = requests.get("https://jsonblob.com/api/jsonBlob/31bf2dc8-00e6-11e7-a0ba-e39b7fdbe78b", timeout=10)
requires:
python3 

pip requires:

numpy
ujson   (which is never used)
  • ujson is removed by @zxj5470 and he changed it into stdlib json,and update the ujson.decode by json.loads

About

摩拜单车爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 81.7%
  • JavaScript 9.0%
  • Python 6.5%
  • Java 1.7%
  • HTML 0.6%
  • CSS 0.5%