安装LTP是非常简单的,使用Pip安装只需要:
pip install ltp
from ltp import LTP
ltp = LTP() # 默认加载 LTP/Small 模型
# ltp = LTP(path = "LTP/base|LTP/small|LTP/tiny")
使用LTP分句只需要调用ltp.sent_split函数
from ltp import StnSplit
sents = StnSplit().sent_split(["他叫汤姆去拿外衣。", "汤姆生病了。他去了医院。"])
# [
# "他叫汤姆去拿外衣。",
# "汤姆生病了。",
# "他去了医院。"
# ]
from ltp import LTP
ltp = LTP()
# 也可以在代码中添加自定义的词语
ltp.add_words(word="长江大桥", freq = 2)
使用LTP分词非常简单,下面是一个简短的例子:
from ltp import LTP
ltp = LTP()
words = ltp.pipeline(["他叫汤姆去拿外衣。"], tasks = ["cws"], return_dict = False)
# [['他', '叫', '汤姆', '去', '拿', '外衣', '。']]
from ltp import LTP
ltp = LTP()
result = ltp.pipeline(["他叫汤姆去拿外衣。"], tasks = ["cws","pos"])
print(result.pos)
# [['他', '叫', '汤姆', '去', '拿', '外衣', '。']]
# [['r', 'v', 'nh', 'v', 'v', 'n', 'wp']]
from ltp import LTP
ltp = LTP()
result = ltp.pipeline(["他叫汤姆去拿外衣。"], tasks = ["cws","ner"])
print(result.ner)
# [['他', '叫', '汤姆', '去', '拿', '外衣', '。']]
from ltp import LTP
ltp = LTP()
result = ltp.pipeline(["他叫汤姆去拿外衣。"], tasks = ["cws","srl"])
print(result.srl)
需要注意的是,在依存句法当中,虚节点ROOT占据了0位置,因此节点的下标从1开始。
from ltp import LTP
ltp = LTP()
result = ltp.pipeline(["他叫汤姆去拿外衣。"], tasks = ["cws","dep"])
print(result.dep)
与依存句法类似的,这里的下标也是从1开始。
from ltp import LTP
ltp = LTP()
result = ltp.pipeline(["他叫汤姆去拿外衣。"], tasks = ["cws","sdp"])
print(result.sdp)
与依存句法类似的,这里的下标也是从1开始。
from ltp import LTP
ltp = LTP()
result = ltp.pipeline(["他叫汤姆去拿外衣。"], tasks = ["cws","sdpg"])
print(result.sdpg)
LTP Server 是对 LTP 的一个简单包装,依赖于 tornado,使用方式如下:
pip install ltp, tornado
python utils/server.py serve