PaddleSlim是一个专注于深度学习模型压缩的工具库,提供剪裁、量化、蒸馏、和模型结构搜索等模型压缩策略,帮助用户快速实现模型的小型化。
PaddleSlim | PaddlePaddle | PaddleLite | 备注 |
---|---|---|---|
1.0.1 | <=1.7 | 2.7 | 支持静态图 |
1.1.1 | 1.8 | 2.7 | 支持静态图 |
1.2.0 | 2.0Beta/RC | 2.8 | 支持静态图 |
2.0.0 | 2.0 | 2.8 | 支持动态图和静态图 |
安装最新版本:
pip install paddleslim -i https://pypi.tuna.tsinghua.edu.cn/simple
安装指定版本:
pip install paddleslim=2.0.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
2021.2.5: 发布V2.0.0版本,新增支持动态图,新增OFA压缩功能,优化剪枝功能。 2020.9.16: 发布V1.2.0版本,新增PACT量化训练功能,新增DML(互蒸馏功能),修复部分剪裁bug,加强对depthwise_conv2d的剪裁能力,优化剪裁和量化API的易用性和灵活性。
更多信息请参考:release note
PaddleSlim支持以下功能,也支持自定义量化、裁剪等功能。
Quantization | Pruning | NAS | Distilling |
---|---|---|---|
|
|
|
|
注:*表示仅支持静态图,**表示仅支持动态图
PaddleSlim在典型视觉和自然语言处理任务上做了模型压缩,并且测试了Nvidia GPU、ARM等设备上的加速情况,这里展示部分模型的压缩效果,详细方案可以参考下面CV和NLP模型压缩方案:
注:
- YOLOv3: 在移动端SD855上加速3.55倍。
- PP-OCR: 体积由8.9M减少到2.9M, 在SD855上加速1.27倍。
- BERT: 模型参数由110M减少到80M,精度提升的情况下,Tesla T4 GPU FP16计算加速1.47倍。
-
通道剪裁
- 四种剪裁策略效果对比与应用方法
- 剪裁功能详解: 动态图 | 静态图
- 自定义剪裁策略:动态图
-
低比特量化
-
NAS
-
蒸馏
-
检测模型压缩(基于PaddleDetection)
- 压缩方案
- YOLOv3 3.5倍加速方案: 文档整理中...
- 方法应用-静态图
- 方法应用-动态图
- 文档整理中...
- 压缩方案
-
分割模型压缩(基于PaddleSeg)
-
压缩方案
- 方案建设中...
-
方法应用-静态图
- 文档整理中...
-
方法应用-动态图
- 文档整理中...
-
本项目的发布受Apache 2.0 license许可认证。
我们非常欢迎你可以为PaddleSlim提供代码,也十分感谢你的反馈。
请添加微信公众号"AIDigest",备注“压缩”,飞桨同学会拉您进入微信交流群。