Skip to content

Latest commit

 

History

History
16 lines (7 loc) · 395 Bytes

readme.md

File metadata and controls

16 lines (7 loc) · 395 Bytes

豆瓣夸夸小组(相互表扬小组)语料抓取

抓取了豆瓣相互表扬小组的前30页讨论中的第一页评论;

抓取的原始数据中, 合计讨论 745 条, 高赞回复 1493 条, 回复 24257 条;

代码使用说明

# cp config.example.json config.json 复制一份 config.json;

编辑 cookie 为浏览器登录后你自己的 cookie;

python main.py;