Skip to content

F-crystal/HmmPosTagger

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 

Repository files navigation

My HMMPosTagger

个人作业,使用北京大学计算语言学教育部重点实验室的现代汉语切分、标注、注音语料库-1998年1月份样例与规范数据生成语料库,对隐马尔可夫模型进行训练,同时利用哈尔滨工业大学开发的LTP语言技术平台对输入句子进行分词处理,从而实现对输入中文句子的词性标注序列预测

更新:使用Stanford Log-linear Part-Of-Speech Tagger生成语料库并进行隐马尔可夫模型训练,同时利用nltk对输入句子进行分词处理,从而实现对输入英文句子的词性标注序列预测

相关链接:

北京大学计算语言学教育部重点实验室:https://klcl.pku.edu.cn/zygx/zyxz/index.htm

哈工大信息检索实验室-LTP 语言技术平台:http://ir.hit.edu.cn/

Stanford Log-linear Part-Of-Speech Tagger:http://nlp.stanford.edu/software/tagger.shtml

工具:使用flask框架,前端使用html+css+javascript,后端使用python

运行项目

推荐使用命令行运行项目

下载项目

git clone https://github.com/F-crystal/HmmPosTagger.git

打开根目录

cd HmmPosTagger

创建虚拟环境

python3 -m venv venv

运行虚拟环境

. venv/bin/activate

安装对应包

包括flask, torch, ltp等(推荐使用pip下载)

pip install flask
pip install torch
pip install ltp
pip install numpy
pip install nltk

打开文件目录

cd hmmpostagger

开始运行吧

flask run

About

使用HMM进行词性标注

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published