Skip to content

Commit

Permalink
add ‘中文谣言数据 github & data’
Browse files Browse the repository at this point in the history
  • Loading branch information
Yang Yang committed Nov 15, 2018
1 parent 4ce5ef6 commit af24c73
Show file tree
Hide file tree
Showing 4 changed files with 31,733 additions and 0 deletions.
Binary file added .DS_Store
Binary file not shown.
15 changes: 15 additions & 0 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -204,4 +204,19 @@ IT词库、财经词库、成语词库、地名词库、历史名人词库、诗
```
该库搜集了包含:豆瓣多轮, PTT八卦语料, 青云语料, 电视剧对白语料, 贴吧论坛回帖语料,微博语料,小黄鸡语料
```
**32\. 中文谣言数据**[github](https://github.com/thunlp/Chinese_Rumor_Dataset)
```
该数据文件中,每一行为一条json格式的谣言数据,字段释义如下:
rumorCode: 该条谣言的唯一编码,可以通过该编码直接访问该谣言举报页面。
title: 该条谣言被举报的标题内容
informerName: 举报者微博名称
informerUrl: 举报者微博链接
rumormongerName: 发布谣言者的微博名称
rumormongerUr: 发布谣言者的微博链接
rumorText: 谣言内容
visitTimes: 该谣言被访问次数
result: 该谣言审查结果
publishTime: 该谣言被举报时间
```
[jieba](https://github.com/fxsjy/jieba)[hanlp](https://github.com/hankcs/pyhanlp)就不必说了吧。
49 changes: 49 additions & 0 deletions data/中文谣言数据/README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,49 @@
# 中文谣言数据

该数据为从新浪微博不实信息举报平台抓取的中文谣言数据,共包含截止至2017年6月13日的31669条谣言。

## 数据集介绍

该数据文件中,每一行为一条json格式的谣言数据,字段释义如下:

* **rumorCode**: 该条谣言的唯一编码,可以通过该编码直接访问该谣言举报页面。
* **title**: 该条谣言被举报的标题内容
* **informerName**: 举报者微博名称
* **informerUrl**: 举报者微博链接
* **rumormongerName**: 发布谣言者的微博名称
* **rumormongerUr**: 发布谣言者的微博链接
* **rumorText**: 谣言内容
* **visitTimes**: 该谣言被访问次数
* **result**: 该谣言审查结果
* **publishTime**: 该谣言被举报时间

## 引用

如果您使用该数据集,请引用以下论文:

* 中文:

```
@article{liu2015rumors,
title={中文社交媒体谣言统计语义分析},
author={刘知远 and 张乐 and 涂存超 and 孙茂松},
journal={中国科学: 信息科学},
volume={12},
pages={1536--1546},
year={2015}
}
```

* English:

```
@article{liu2015rumors,
title={Statistical and semantic analysis of rumors in Chinese social media},
author={Liu, Zhiyuan and Zhang, Le and Tu, Cunchao and Sun, Maosong},
journal={Scientia Sinica Informationis},
volume={45},
number={12},
pages={1536},
year={2015}
}
```
Loading

0 comments on commit af24c73

Please sign in to comment.