Skip to content

Latest commit

 

History

History
15 lines (8 loc) · 305 Bytes

README.md

File metadata and controls

15 lines (8 loc) · 305 Bytes

OA_System

建立语料库。

建立中文的语料库。思路:从电影字幕或者小说中提取对话,初步建立对话语料库。

语料库来源:

1.字幕网站

2.小说网站

word2vec 使用weiki中文作为语料。

以汽车之家、天涯等论坛的评论作为对话语料。