爬取雨课堂的答案。注意,需要你先答一遍题,有答案之后才能爬取!
记得安装好selenium
pip install selenium
pip install tqdm
本项目默认以Chrome为例,以Windows系统为例。其他浏览器原理类似、其他操作系统原理类似。
首先电脑上要安装有Chrome浏览器(别装到假的Chrome了,之前有同学装了个假Chrome后来问我为什么程序不能正常运行QAQ)
其次需要下载对应版本的ChromeDriver
:下载地址1、下载地址2、下载地址3、教程1、教程2、最后的尝试。(版本相差不大的话也无所谓)
将ChromeDriver.exe
放到环境变量
中 或 脚本(执行)目录
下。
打开main.py
,代码头部存在以下信息,需要你自己修改:
IF_HEADLESS = False # 是否以无窗口模式运行(首次运行建议使用有窗口模式以观察是否符合预期)
COURSE_URL = 'https://grsbupt.yuketang.cn/pro/lms/84eubUXLHEy/17556639/studycontent' # 要刷的课的地址(获取方式见README)
COOKIE = 'sjfeij2983uyfh84y7498uf98ys8f8u9' # 打死也不要告诉别人哦(获取方式见README)
是否以无窗口模式运行。建议以有窗口模式运行(那就不用改这一行了)。
若以无窗口模式运行,则不会弹出Chrome浏览器界面,但视频仍能正常刷取。
你要刷的课的URL。
进入雨课堂,进入你想要获取答案的课程,点击“学习内容”,复制地址栏的url即可。
(注意是https格式的哦)
若你觉得COOKIE的获取比较麻烦,你可以选择跳过这一步并每次重新扫码登录。扫码登录不支持HEADLESS模式。
COOKIE用来告诉雨课堂你是你。获取方式如下:
登录(你们学校的)雨课堂,打开开发者工具
(下图的步骤1,也可百度),依次点击“应用→存储→Cookie→ https://xxx.yuketang... ”,复制sessionid对应的值
不同的课程的输出格式不同请按需修改,answer.txt
是一个格式示例。
输入python main.py
以启动