Skip to content

Latest commit

 

History

History
58 lines (43 loc) · 1.48 KB

README.md

File metadata and controls

58 lines (43 loc) · 1.48 KB

My HMMPosTagger

个人作业,使用北京大学计算语言学教育部重点实验室的现代汉语切分、标注、注音语料库-1998年1月份样例与规范数据生成语料库,对隐马尔可夫模型进行训练,同时利用哈尔滨工业大学开发的LTP语言技术平台对输入句子进行分词处理,从而实现对输入中文句子的词性标注序列预测

更新:使用Stanford Log-linear Part-Of-Speech Tagger生成语料库并进行隐马尔可夫模型训练,同时利用nltk对输入句子进行分词处理,从而实现对输入英文句子的词性标注序列预测

相关链接:

北京大学计算语言学教育部重点实验室:https://klcl.pku.edu.cn/zygx/zyxz/index.htm

哈工大信息检索实验室-LTP 语言技术平台:http://ir.hit.edu.cn/

Stanford Log-linear Part-Of-Speech Tagger:http://nlp.stanford.edu/software/tagger.shtml

工具:使用flask框架,前端使用html+css+javascript,后端使用python

运行项目

推荐使用命令行运行项目

下载项目

git clone https://github.com/F-crystal/HmmPosTagger.git

打开根目录

cd HmmPosTagger

创建虚拟环境

python3 -m venv venv

运行虚拟环境

. venv/bin/activate

安装对应包

包括flask, torch, ltp等(推荐使用pip下载)

pip install flask
pip install torch
pip install ltp
pip install numpy
pip install nltk

打开文件目录

cd hmmpostagger

开始运行吧

flask run