From 10a7b9478c10c71d2f71b18089c5330bbc9e3f93 Mon Sep 17 00:00:00 2001 From: ylfeng Date: Tue, 1 Dec 2020 13:30:17 +0800 Subject: [PATCH] =?UTF-8?q?=E6=8A=8A=E6=A8=A1=E5=9E=8B=E4=B8=8B=E8=BD=BD?= =?UTF-8?q?=E5=9C=B0=E5=9D=80=E7=8B=AC=E7=AB=8B=E5=87=BA=E6=9D=A5?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- MODELS.md | 42 ++++++++++++++++++++++++++++++++++++++++++ README.md | 40 ++-------------------------------------- 2 files changed, 44 insertions(+), 38 deletions(-) create mode 100644 MODELS.md diff --git a/MODELS.md b/MODELS.md new file mode 100644 index 000000000..616f15974 --- /dev/null +++ b/MODELS.md @@ -0,0 +1,42 @@ +# 模型下载 + +| 模型 | 大小 | sha256 | +| :-------: | :---------------------------------------------: | :--------------------------------------------------------------: | +| Base(v3) | [491.9MB](http://39.96.43.154/ltp/v3/base.tgz) | 5c24a476d505a8c0a3385bbecb0ce816e876922450edf93e2d2bc6f3a01795ca | +| Small(v3) | [156.8MB](http://39.96.43.154/ltp/v3/small.tgz) | 2a9a090f84ae0effc37c3d5ba2cb20e2856b149b380eeeebc6f9b3808ad8e9e4 | +| Tiny(v3) | [31.3MB](http://39.96.43.154/ltp/v3/tiny.tgz) | 0f40bce82c4610829aabb3363e82305289ced721cc846631907af3594bea453e | +| Base(v2) | [531MB](http://39.96.43.154/ltp/v2/base.tgz) | 4ba5b16e90c073fced2ba45ebd6a663e78bf081f8a83a3d68582d53ce544ed3a | +| Small(v2) | [170MB](http://39.96.43.154/ltp/v2/small.tgz) | 26e79fc2912bf2ed9bff72c1de908045e471e4f520b1652f9db246bc38b7b6c6 | +| Tiny(v2) | [34MB](http://39.96.43.154/ltp/v2/tiny.tgz) | 8ed110819c9fd600c1e9cd99a82107d79c804b93d0701055e9215b93035393ba | +| Small(v1) | [170MB](http://39.96.43.154/ltp/v1/small.tgz) | d78bd6507eb4b1a45859ca4d36065dc6ce69202a8fc0edfdce29934fd8307222 | +| Tiny(v1) | [34MB](http://39.96.43.154/ltp/v1/tiny.tgz) | 877bb0cd97d82fdbd2c6f74144c4f9abf9e44ce79075cd17bde02abe314a1e49 | + +**注意**: LTP 4.1.X 与旧版本 v1,v2 模型不兼容 +**备注**: Tiny模型使用electra前三层进行初始化 + +## V2/v3 指标 + +| 模型 | 分词 | 词性 | 命名实体 | 语义角色 | 依存句法 | 语义依存 | 速度(句/S) | +| :-------------: | :---: | :---: | :------: | :------: | :------: | :------: | :--------: | +| LTP 4.0 (Base) | 98.7 | 98.5 | 95.4 | 80.6 | 89.5 | 75.2 | | +| LTP 4.0 (Small) | 98.4 | 98.2 | 94.3 | 78.4 | 88.3 | 74.7 | 12.58 | +| LTP 4.0 (Tiny) | 96.8 | 97.1 | 91.6 | 70.9 | 83.8 | 70.1 | 29.53 | + +**备注**: 本版本SDP采用 [CCL2020语义依存分析](http://ir.hit.edu.cn/sdp2020ccl) 语料,其他语料同V1 + +## V1 指标 + +| 模型 | 分词 | 词性 | 命名实体 | 语义角色 | 依存句法 | 语义依存 | 速度(句/S) | 模型大小 | +| :-------------: | :---: | :---: | :------: | :----------------: | :------: | :------: | :--------: | :------: | +| LTP 3.X | 97.8 | 98.3 | 94.1 | ~~77.92(Gold Pi)~~ | 81.1 | ~~78.9~~ | 2.75 | 1940M | +| LTP 4.0 (Small) | 98.4 | 98.2 | 94.3 | 77.2(端到端) | 88.0 | 79.9 | 12.58 | 171M | +| LTP 4.0 (Tiny) | 96.8 | 97.2 | 91.6 | 68.1(端到端) | 82.6 | 75.5 | 29.53 | 34M | + +测试环境如下: + ++ Python 3.7 ++ LTP 4.0 Batch Size = 1 ++ Centos 3.10.0-1062.9.1.el7.x86_64 ++ Intel(R) Xeon(R) CPU E5-2640 v4 @ 2.40GHz + +**备注**: 速度数据在人民日报命名实体测试数据上获得,速度计算方式均为所有任务顺序执行的结果。另外,语义角色标注与语义依存新旧版采用的语料不相同,因此无法直接比较(新版语义依存使用Semeval 2016语料,语义角色标注使用CPB3.0语料)。 diff --git a/README.md b/README.md index 2aff8f14c..6440a60df 100644 --- a/README.md +++ b/README.md @@ -35,26 +35,7 @@ sdp = ltp.sdp(hidden) **[详细说明](docs/quickstart.rst)** -## 模型 - -### 模型下载 - -| 模型 | 大小 | sha256 | -| :-------: | :---------------------------------------------: | :--------------------------------------------------------------: | -| Base(v3) | [491.9MB](http://39.96.43.154/ltp/v3/base.tgz) | 5c24a476d505a8c0a3385bbecb0ce816e876922450edf93e2d2bc6f3a01795ca | -| Small(v3) | [156.8MB](http://39.96.43.154/ltp/v3/small.tgz) | 2a9a090f84ae0effc37c3d5ba2cb20e2856b149b380eeeebc6f9b3808ad8e9e4 | -| Tiny(v3) | [31.3MB](http://39.96.43.154/ltp/v3/tiny.tgz) | 0f40bce82c4610829aabb3363e82305289ced721cc846631907af3594bea453e | -| Base(v2) | [531MB](http://39.96.43.154/ltp/v2/base.tgz) | 4ba5b16e90c073fced2ba45ebd6a663e78bf081f8a83a3d68582d53ce544ed3a | -| Small(v2) | [170MB](http://39.96.43.154/ltp/v2/small.tgz) | 26e79fc2912bf2ed9bff72c1de908045e471e4f520b1652f9db246bc38b7b6c6 | -| Tiny(v2) | [34MB](http://39.96.43.154/ltp/v2/tiny.tgz) | 8ed110819c9fd600c1e9cd99a82107d79c804b93d0701055e9215b93035393ba | -| Small(v1) | [170MB](http://39.96.43.154/ltp/v1/small.tgz) | d78bd6507eb4b1a45859ca4d36065dc6ce69202a8fc0edfdce29934fd8307222 | -| Tiny(v1) | [34MB](http://39.96.43.154/ltp/v1/tiny.tgz) | 877bb0cd97d82fdbd2c6f74144c4f9abf9e44ce79075cd17bde02abe314a1e49 | - -**备注**: Tiny模型使用electra前三层进行初始化, 4.0.3.post1 版本包含对v1模型的fix,新版本请使用v2模型, 其中v3模型是从v2转换得来 - -**注意**: LTP 4.1.X 与旧版本 v1,v2 模型不兼容 - -### V2/v3 指标 +## 指标 | 模型 | 分词 | 词性 | 命名实体 | 语义角色 | 依存句法 | 语义依存 | 速度(句/S) | | :-------------: | :---: | :---: | :------: | :------: | :------: | :------: | :--------: | @@ -62,24 +43,7 @@ sdp = ltp.sdp(hidden) | LTP 4.0 (Small) | 98.4 | 98.2 | 94.3 | 78.4 | 88.3 | 74.7 | 12.58 | | LTP 4.0 (Tiny) | 96.8 | 97.1 | 91.6 | 70.9 | 83.8 | 70.1 | 29.53 | -**备注**: 本版本SDP采用 [CCL2020语义依存分析](http://ir.hit.edu.cn/sdp2020ccl) 语料,其他语料同V1 - -### V1 指标 - -| 模型 | 分词 | 词性 | 命名实体 | 语义角色 | 依存句法 | 语义依存 | 速度(句/S) | 模型大小 | -| :-------------: | :---: | :---: | :------: | :----------------: | :------: | :------: | :--------: | :------: | -| LTP 3.X | 97.8 | 98.3 | 94.1 | ~~77.92(Gold Pi)~~ | 81.1 | ~~78.9~~ | 2.75 | 1940M | -| LTP 4.0 (Small) | 98.4 | 98.2 | 94.3 | 77.2(端到端) | 88.0 | 79.9 | 12.58 | 171M | -| LTP 4.0 (Tiny) | 96.8 | 97.2 | 91.6 | 68.1(端到端) | 82.6 | 75.5 | 29.53 | 34M | - -测试环境如下: - -+ Python 3.7 -+ LTP 4.0 Batch Size = 1 -+ Centos 3.10.0-1062.9.1.el7.x86_64 -+ Intel(R) Xeon(R) CPU E5-2640 v4 @ 2.40GHz - -**备注**: 速度数据在人民日报命名实体测试数据上获得,速度计算方式均为所有任务顺序执行的结果。另外,语义角色标注与语义依存新旧版采用的语料不相同,因此无法直接比较(新版语义依存使用Semeval 2016语料,语义角色标注使用CPB3.0语料)。 +**[模型下载地址](MODELS.md)** ## 模型算法