文本分类(Text Classification)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,比如垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的知识库分类等等。本文分为两个部分:
- Part 1: 数据集划分 prepare_datasets.py
- Part 2: 模型训练 run_ccb_text_classification.py & run_online_shopping_text_classification.py