LTP v3.0.0 发布
- 从底层开始,实现了一套中文文本处理库
- 实现在线机器学习算法框架
- 在算法框架基础上实现了分词、词性标注、命名实体识别和依存句法分析四个模块
- 实现模型裁剪,提高内存性能
- 实现L1优化的最大熵模型,大幅度提高内存性能
- 在L1优化最大熵的基础上实现语义角色标注模块
- 在分词模块中实现了用户自定义字典的逻辑
- 在依存句法分析模块中实现了二阶解码,提高分析准确率
- 完善了训练套件,使用户可以更灵活地训练模型
LTP v2.2 发布
- 项目从采用Automake改为采用CMake编译
- 解决LTP对于boost库以及其他一些第三方库的依赖
- 将分词、词性标注、依存句法分析以及语义角色标注的训练模块开源
- 重制了部分文档
- 修复了高版本GCC不能编译的bug
LTP正式开源
LTP v2.1 发布
- 增加CRFWordSeg接口
- 解决了若干svmtagger的bug
- 解决了若干ner的bug
- 解决LTP对文字进行修改的bug
- 解决使用vector作为DLL接口参数类型的bug (VS2008下出错)
- 更新LTP使用文档
- 最新版我们只提供vs2008对应的DLL,如果希望在visual studio其他版本上运行,可以尝试安装Microsoft Visual C++ 2008 Redistributable Package (x86)
LTP v1.5.0 发布
LTP v1.4.3 发布
LTP v1.4.1 发布
LTP v1.4.0 发布
LTP v1.3 发布
- IRLAS的extend_dict解密,不采用加密文件
- 解决Parser越界错误
- 采用LTMLv2.0格式
- 发布python包
- 补充英文文档