- 将众包完成的口算数据集通过脚本/代码处理的方式,完成数据集的准备,训练集/测试集的比例划分;
- 在训练前完成预处理操作,不仅限于翻转,加噪等视觉数据增强方法;
- 基于YOLO预训练模型在口算数据集进行模型微调训练,在实验内容中给出预处理前后不同模型在测试集上的性能对比。
- 使用Weights & Biases或TensorBoard等工具完成模型训练的可视化。
- 通过代码处理的方式对数据集中的图片进行旋转,扭曲等几何失真(opencv库中图像处理仿射变换等算子)仿真,以模仿真实场景的拍摄失真。
- 基于YOLO-OBB模型在增强后的数据集上进行模型微调训练,在实验内容中给出预处理前后不同模型在测试集上的性能对比。