A backup tool for renren.com
理论上 Python 2.7+ 和 Python 3.6+ 都可以用 (我是在 Windows 10 + Python 3.7.0 的环境下测试的)
用 pipenv 构建虚拟环境
pipenv --python 3.7.0
pipenv install
pipenv shell
或者用 virtualenv 构建
virtualenv env
source env/bin/activate
pip install -r requirements.txt
直接运行 fetch.py
即可,相关参数见下,不输入用户名密码是不会抓取的,不带各种抓取参数就是只登陆不抓取
-s
状态-g
留言板-a
相册-b
日志-u
要抓的人的人人 uid(仅能抓取当前登录账户可见的内容)-r
强制更新已抓取用户的统计信息
# 查看详细的命令参数
$ python fetch.py --help
usage: fetch.py [-h] [-s] [-g] [-a] [-b] [-u FETCH_UID] [-r] email password
fetch renren data to backup
positional arguments:
email your renren email for login
password your renren password for login
optional arguments:
-h, --help show this help message and exit
-s, --fetch-status fetch status or not
-g, --fetch-gossip fetch gossip or not
-a, --fetch-album fetch album or not
-b, --fetch-blog fetch blog or not
-u FETCH_UID, --fetch-uid FETCH_UID
user to fetch, or the login user by default
-r, --refresh-count refresh fetched user count
# 抓取自己的所有信息
$ python fetch.py [email protected] passwordAtRenren -s -g -a -b
# 指定抓取某人的状态
$ python fetch.py [email protected] passwordAtRenren -s -u 30314
# 强制更新某人的抓取统计信息
$ python fetch.py [email protected] passwordAtRenren -u 30314 -r
如果遇到要登录验证码的情况,在终端提示时输入自动打开的图片上的四个汉字即可。如果没有自动打开验证码图片,可到项目的 /static/img/icode.jpg
找到,自行打开并输入验证码
直接运行如下命令,即可在本机浏览器打开 localhost:5000
看到展示
python web.py
将抓取的页面和静态文件统一打包,将打包文件解压后可以不启动 flask 也能查看
python export.py backup.tar
- 纯静态输出,不用启 flask 也能查看(把评论点赞数据也输出到页面,js 只控制是否展示)
- 备份打包
- 纯动态输出,学习用 Vue.js
- 可以抓别人的记录
- 同时展示多人记录
- 强制重抓之前抓挂的图(还挂就替换成默认图)