Skip to content

数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理微博文本;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图

Notifications You must be signed in to change notification settings

Comatosethinker/DataScienceAssignment

 
 

Repository files navigation

数据科学大作业

具体内容见pdf

这个是我在20年下学期的作业,有人提issue说运行不了,结果是

不仅fake useragent挂了,连weibo.cn的关键词搜索接口都失效了(2021.6.6)

只要把爬虫文件里的cookie换成你的应该就跑的起来

当然还要改日期和关键词

About

数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理微博文本;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • HTML 58.2%
  • Python 41.8%