From 3dd3e7bc790133492f289ee0dba188ff459750c0 Mon Sep 17 00:00:00 2001 From: Xusheng Date: Sat, 21 Oct 2017 11:02:48 +0800 Subject: [PATCH] add 201710 model --- w2v.markdown | 11 ++++++++++- 1 file changed, 10 insertions(+), 1 deletion(-) diff --git a/w2v.markdown b/w2v.markdown index 4783b62..80bcde8 100644 --- a/w2v.markdown +++ b/w2v.markdown @@ -2,7 +2,16 @@ 下面提供一些训练好的 Word2Vector 模型,供大家使用。 -### 最新版(推荐) +### 201710 + +使用 2017 年 10 月的 Wiki 中文语料训练,使用 Skip-Gram 模型训练,单词维数 300,训练窗口 10。 + +- 【模型】[Google_word2vec_zhwiki1710_300d.bin](http://pan.baidu.com/s/1i4BLryH) +- 【语料】[zhwiki_1710_preprocessed.simplied.zip](http://pan.baidu.com/s/1hsMmRbu) + +注:语料已经使用 [AHANLP](https://github.com/jsksxs360/AHANLP) 做过分词处理(未去停用词)。 + +### 201709 使用 2017 年 9 月的 Wiki 中文语料训练,使用 Skip-Gram 模型训练,单词维数 300,训练窗口 5。