Skip to content

Commit

Permalink
add THU word bank
Browse files Browse the repository at this point in the history
  • Loading branch information
Yang Yang committed Oct 22, 2018
1 parent 3b55ee4 commit d854005
Show file tree
Hide file tree
Showing 14 changed files with 112,375 additions and 1 deletion.
7 changes: 6 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,7 +2,7 @@

很多包非常有趣,值得收藏,满足大家的收集癖!

涉及内容包括:**中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库**
涉及内容包括:**中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库**

**1\. textfilter: 中英文敏感词过滤** [observerss/textfilter](https://github.com/observerss/textfilter)
```
Expand Down Expand Up @@ -205,5 +205,10 @@ Hi,all。下周一下午三点开会

**30\. 古诗词库:** [github repo](https://github.com/panhaiqi/AncientPoetry)

**31\. THU整理的词库:** [link](http://thuocl.thunlp.org/sendMessage)

```
IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库
```

[jieba](https://github.com/fxsjy/jieba)[hanlp](https://github.com/hankcs/pyhanlp)就不必说了吧。
Binary file modified data/.DS_Store
Binary file not shown.
Loading

0 comments on commit d854005

Please sign in to comment.