模型 | 大小 | SHA256 |
---|---|---|
Base1(v3) | 583MB | 397c3893e39692ced5858930e0cf8556454747a7c76521d70423a147d6f8c6d7 |
Base2(v3) | 583MB | 685a195f09c1947231394ef1bb814e8608252888a9a6dcc1fa5080a5a186e096 |
Base(v3) | 491.9MB | 777a97d6770285e5ab3b0720923bc86781e3279508a72a30c2dd9140b09e5ec8 |
Small(v3) | 156.8MB | 0992d5037cd1c62779a3b5c6d45b883a46e4782c6bcc5850117faf69a9ee6c56 |
Tiny(v3) | 31.3MB | d0ab69f1493db232676423270d481080bf636bf8547e4297129b6a21c6f73612 |
Base(v2) | 531MB | 4ba5b16e90c073fced2ba45ebd6a663e78bf081f8a83a3d68582d53ce544ed3a |
Small(v2) | 170MB | 26e79fc2912bf2ed9bff72c1de908045e471e4f520b1652f9db246bc38b7b6c6 |
Tiny(v2) | 34MB | 8ed110819c9fd600c1e9cd99a82107d79c804b93d0701055e9215b93035393ba |
Small(v1) | 170MB | d78bd6507eb4b1a45859ca4d36065dc6ce69202a8fc0edfdce29934fd8307222 |
Tiny(v1) | 34MB | 877bb0cd97d82fdbd2c6f74144c4f9abf9e44ce79075cd17bde02abe314a1e49 |
注意: LTP 4.1.X 与旧版本 v1,v2 模型不兼容 备注: Tiny模型使用electra前三层进行初始化
模型 | 分词 | 词性 | 命名实体 | 语义角色 | 依存句法 | 语义依存 | 速度(句/S) |
---|---|---|---|---|---|---|---|
LTP 4.0 (Base) | 98.7 | 98.5 | 95.4 | 80.6 | 89.5 | 75.2 | 39.12 |
LTP 4.0 (Base1) | 99.22 | 98.73 | 96.39 | 79.28 | 89.57 | 76.57 | --.-- |
LTP 4.0 (Base2) | 99.18 | 98.69 | 95.97 | 79.49 | 90.19 | 76.62 | --.-- |
LTP 4.0 (Small) | 98.4 | 98.2 | 94.3 | 78.4 | 88.3 | 74.7 | 43.13 |
LTP 4.0 (Tiny) | 96.8 | 97.1 | 91.6 | 70.9 | 83.8 | 70.1 | 53.22 |
备注: 本版本SDP采用 CCL2020语义依存分析 语料,其他语料同V1
测试环境如下:
- Python 3.8.5
- LTP 4.1 Batch Size = 8
- CentOS Linux release 8.3.2011
- Tesla V100-SXM2-16GB
- Intel(R) Xeon(R) Silver 4214R CPU @ 2.40GHz
备注: 速度数据在人民日报命名实体测试数据上获得,速度计算方式均为所有任务顺序执行的结果。另外,语义角色标注与语义依存新旧版采用的语料不相同,因此无法直接比较(新版语义依存使用Semeval 2016语料,语义角色标注使用CPB3.0语料)。
模型 | 分词 | 词性 | 命名实体 | 语义角色 | 依存句法 | 语义依存 | 速度(句/S) | 模型大小 |
---|---|---|---|---|---|---|---|---|
LTP 3.X | 97.8 | 98.3 | 94.1 | 81.1 | 2.75 | 1940M | ||
LTP 4.0 (Small) | 98.4 | 98.2 | 94.3 | 77.2(端到端) | 88.0 | 79.9 | 12.58 | 171M |
LTP 4.0 (Tiny) | 96.8 | 97.2 | 91.6 | 68.1(端到端) | 82.6 | 75.5 | 29.53 | 34M |
测试环境如下:
- Python 3.7
- LTP 4.0 Batch Size = 1
- Centos 3.10.0-1062.9.1.el7.x86_64
- Intel(R) Xeon(R) CPU E5-2640 v4 @ 2.40GHz
备注: 速度数据在人民日报命名实体测试数据上获得,速度计算方式均为所有任务顺序执行的结果。另外,语义角色标注与语义依存新旧版采用的语料不相同,因此无法直接比较(新版语义依存使用Semeval 2016语料,语义角色标注使用CPB3.0语料)。
模型 | 分词 | 词性(XPOS) | 命名实体 | 依存句法 | SHA256 |
---|---|---|---|---|---|
GSD(Single) | 98.4 | 96.67 | 75.01 | 86.72 | - |
GSD + OntoNotes (GSD) | 98.4 | 96.85 | 78.56 | 87.24 | e4fd41c6f2c6d84d6df2657f1e47078cb98364366d91e852f0980102c755592a |
GSD + OntoNotes (GSD+CRF) | 98.26 | 96.38 | 79.77 | 86.57 | 0264b4a92e34bb97054ff06f99068b884c54908d1ad265926b0983f2594e1e6a |
GSDSimple(Single) | 98.29 | 96.69 | 76.67(+CRF) | 87.2 | - |
GSDSimp + OntoNotes (GSDSimp) | 98.44 | 96.84 | 78.06 | 87.58 | d51b8508f290ab82d1c3844541eb774506213c1f6cf7d2b86fe7d69358d0d52a |
GSDSimp + OntoNotes (GSDSimp+CRF) | 98.4 | 96.47 | 79.69 | 86.39 | 1e9ea20cfbc1837bf5736f8b8502aaecb9343590e98b04bba18e15724d3092b2 |
模型 | 分词 | 词性(XPOS) | 命名实体 | 依存句法 | SHA256 |
---|---|---|---|---|---|
GSD + OntoNotes (GSD) | 98.12 | 97.22 | 78.56 | 86.91 | e4fd41c6f2c6d84d6df2657f1e47078cb98364366d91e852f0980102c755592a |
GSD + OntoNotes (GSD+CRF) | 97.96 | 96.81 | 79.77 | 86.06 | 0264b4a92e34bb97054ff06f99068b884c54908d1ad265926b0983f2594e1e6a |
GSDSimp + OntoNotes (GSDSimp) | 97.49 | 96.24 | 78.06 | 82.48 | d51b8508f290ab82d1c3844541eb774506213c1f6cf7d2b86fe7d69358d0d52a |
GSDSimp + OntoNotes (GSDSimp+CRF) | 97.25 | 96.22 | 79.69 | 82.92 | 1e9ea20cfbc1837bf5736f8b8502aaecb9343590e98b04bba18e15724d3092b2 |