PaddleSlim/ce_tests/dygraph/quant at develop · lizexu123/PaddleSlim

readme.md

安装需要测试的Paddle版本和PaddleSlim版本。

准备ImageNet数据集。假定解压到/dataset/ILSVRC2012文件夹，该文件夹下有train文件夹、val文件夹、train_list.txt和val_list.txt文件。

通过export CUDA_VISIBLE_DEVICES=xx指定需要使用的GPU ID。

在run_ptq.sh中设置数据路径，比如data_path="/dataset/ILSVRC2012"。

执行sh run_ptq.sh，会使用动态图离线量化方法量化mobilenetv1、mobilenetv2、resnet50和vgg16模型。

执行完成，量化模型保存在当前output_ptq目录下。比如output_ptq/mobilenet_v1/fp32_infer是原始FP32模型，output_ptq/mobilenet_v1/int8_infer是PTQ量化模型。

在run_qat.sh文件中设置data_path为上述ImageNet数据集的路径/dataset/ILSVRC2012。

执行sh run_train.sh 会对几个分类模型使用动态图量化训练功能进行量化，其中只执行一个epoch。

执行完后，在output_qat目录下有产出的量化模型。比如output_qat/mobilenet_v1是QAT量化模型。

在X86 CPU上部署量化模型，需要使用src/save_quant_model.py脚本对量化模型进行转换。

如下是对output_qat/mobilenet_v1模型进行转换的示例。

sh run_convert.sh output_qat/mobilenet_v1 int8_qat_models/mobilenet_v1

按照上述示例，将所有QAT和PTQ产出的量化模型进行转换，假定分别保存在int8_qat_models和int8_ptq_models文件中。

在run_test.sh脚本中设置data_path为上述ImageNet数据集的路径/dataset/ILSVRC2012。

使用run_test.sh脚本测试原始FP32模型（共4个）的精度，可以开启GPU，举例如下。

sh run_test.sh output_ptq/mobilenet_v1/fp32_infer/ True

使用run_test.sh脚本测试转换前PTQ和QAT量化模型(分别4个)的精度，可以开启GPU，举例如下。

sh run_test.sh output_qat/mobilenet_v1 True

使用run_test.sh脚本测试转换后PTQ和QAT量化模型（分别4个）的精度，不可以开启GPU，举例如下。

sh run_test.sh int8_qat_models/mobilenet_v1 False

使用动态图离线量化功能，产出mobilenet_v1,mobilenet_v2,resnet50,vgg16量化模型，测试转换前后量化模型精度在1%误差范围内。