forked from HIT-SCIR/ltp
-
Notifications
You must be signed in to change notification settings - Fork 0
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
doc document update about postagger lexicon
- Loading branch information
Showing
1 changed file
with
17 additions
and
4 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -1,10 +1,10 @@ | ||
LTP使用文档v3.0 | ||
=============== | ||
|
||
#### 作者 | ||
|
||
* 刘一佳 << [email protected]>> 2013年7月17日创建文档 | ||
|
||
版权所有:哈尔滨工业大学社会计算与信息检索研究中心 | ||
|
||
## 目录 | ||
|
@@ -273,6 +273,12 @@ ltp_test的使用方法如下: | |
|参数名 | 参数描述 | | ||
|-------|----------| | ||
|const char * path | 词性标注模型路径 | | ||
|const char * lexicon_file | 指定词性标注外部词典路径。如果lexicon_file为NULL,则不加载外部词典 | | ||
|
||
lexicon_file参数指定的外部词典文件样例如下所示。每行指定一个词,第一列指定单词,第二列之后指定该词的候选词性(可以有多项,每一项占一列),列与列之间用空格区分。 | ||
|
||
雷人 v a | ||
】 wp | ||
|
||
返回值: | ||
|
||
|
@@ -950,7 +956,7 @@ otpos主要通过配置文件指定执行的工作,其中主要有两类配置 | |
其中, | ||
|
||
* [train] 配置组指定执行训练 | ||
* ttain-file 配置项指定训练集文件 | ||
* train-file 配置项指定训练集文件 | ||
* holdout-file 配置项指定开发集文件 | ||
* algorithm 指定参数学习方法,现在otcws支持两种参数学习方法,分别是passive aggressive(pa)和average perceptron(ap)。 | ||
* model-name 指定输出模型文件名 | ||
|
@@ -962,12 +968,19 @@ otpos主要通过配置文件指定执行的工作,其中主要有两类配置 | |
[test] | ||
test-file = data/ctb5-test.pos | ||
model-file = model/ctb5-pos.3.model | ||
lexicon-file = lexicon/pos-lexicon.constrain | ||
|
||
其中, | ||
|
||
* [test] 配置组指定执行测试 | ||
* test-file 指定测试文件 | ||
* model-file 指定模型文件位置 | ||
* lexicon-file 指定外部词典文件位置(此项可以不配置) | ||
|
||
lexicon-file文件样例如下所示。每行指定一个词,第一列指定单词,第二列之后指定该词的候选词性(可以有多项,每一项占一列),列与列之间用空格区分。 | ||
|
||
雷人 v a | ||
】 wp | ||
|
||
词性标注结果将输入到标准io中。 | ||
|
||
|