Skip to content

Commit

Permalink
doc document update about postagger lexicon
Browse files Browse the repository at this point in the history
  • Loading branch information
niuox committed May 9, 2014
1 parent 6c42cfc commit 018d67e
Showing 1 changed file with 17 additions and 4 deletions.
21 changes: 17 additions & 4 deletions doc/ltp-document-3.0.md
Original file line number Diff line number Diff line change
@@ -1,10 +1,10 @@
LTP使用文档v3.0
===============

#### 作者

* 刘一佳 << [email protected]>> 2013年7月17日创建文档

版权所有:哈尔滨工业大学社会计算与信息检索研究中心

## 目录
Expand Down Expand Up @@ -273,6 +273,12 @@ ltp_test的使用方法如下:
|参数名 | 参数描述 |
|-------|----------|
|const char * path | 词性标注模型路径 |
|const char * lexicon_file | 指定词性标注外部词典路径。如果lexicon_file为NULL,则不加载外部词典 |

lexicon_file参数指定的外部词典文件样例如下所示。每行指定一个词,第一列指定单词,第二列之后指定该词的候选词性(可以有多项,每一项占一列),列与列之间用空格区分。

雷人 v a
】 wp

返回值:

Expand Down Expand Up @@ -950,7 +956,7 @@ otpos主要通过配置文件指定执行的工作,其中主要有两类配置
其中,

* [train] 配置组指定执行训练
* ttain-file 配置项指定训练集文件
* train-file 配置项指定训练集文件
* holdout-file 配置项指定开发集文件
* algorithm 指定参数学习方法,现在otcws支持两种参数学习方法,分别是passive aggressive(pa)和average perceptron(ap)。
* model-name 指定输出模型文件名
Expand All @@ -962,12 +968,19 @@ otpos主要通过配置文件指定执行的工作,其中主要有两类配置
[test]
test-file = data/ctb5-test.pos
model-file = model/ctb5-pos.3.model
lexicon-file = lexicon/pos-lexicon.constrain

其中,

* [test] 配置组指定执行测试
* test-file 指定测试文件
* model-file 指定模型文件位置
* lexicon-file 指定外部词典文件位置(此项可以不配置)

lexicon-file文件样例如下所示。每行指定一个词,第一列指定单词,第二列之后指定该词的候选词性(可以有多项,每一项占一列),列与列之间用空格区分。

雷人 v a
】 wp

词性标注结果将输入到标准io中。

Expand Down

0 comments on commit 018d67e

Please sign in to comment.