任务是基于图书的相关描述和图书的封面图片,自动给一个图书做类目的分类。这种任务是一个中文文本分类任务,也可以看作一个多模态分类任务。
2. 机器学习模型(包括RandomForestClassifier随机森林,LogisticRegression逻辑回归,MultinomialNB朴素贝叶斯,SVC支持向量机,LightGBM梯度提升决策树等等)
data
: 数据存放目录
model
: 模型存放目录
logs
: 日志存放目录
src
: 核心代码部分
app.py
: 代码部署部分
src/data
: 数据处理部分
src/data/dataset.py
: 主要用于深度学习的数据处理
src/data/mlData.py
: 主要用于机器学习的数据处理
src/DL/
: 包含各类深度学习模型, 运行主入口为src/DL/train.py
src/ML/
: 包含各类机器学习模型, 运行主入口为src/ML/main.py
src/utils/
: 包含配置文件,特征工程函数,以及通用函数
src/word2vec/
: 包含各类embedding的训练,保存加载。运行主入口为src/word2vec/embedding.py