Name		Name	Last commit message	Last commit date
Latest commit History 810 Commits
.hooks		.hooks
ce_tests/dygraph/quant		ce_tests/dygraph/quant
demo		demo
docs		docs
paddleslim		paddleslim
tests		tests
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.style.yapf		.style.yapf
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md
requirements.txt		requirements.txt
setup.py		setup.py

Repository files navigation

PaddleSlim

简介

PaddleSlim是一个专注于深度学习模型压缩的工具库，提供剪裁、量化、蒸馏、和模型结构搜索等模型压缩策略，帮助用户快速实现模型的小型化。

版本对齐

PaddleSlim	PaddlePaddle	PaddleLite
1.0.1	<=1.7	2.7
1.1.1	1.8	2.7
1.2.0	2.0Beta/RC	2.8
2.0.0	2.0	2.8
2.1.0	2.1.0	2.8
2.1.1	2.1.1	>=2.8

安装

安装最新版本：

pip install paddleslim -i https://pypi.tuna.tsinghua.edu.cn/simple

安装指定版本：

pip install paddleslim==2.1.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

功能概览

PaddleSlim支持以下功能，也支持自定义量化、裁剪等功能。

Quantization	Pruning	NAS	Distilling
QAT PACT PTQ Static PTQ Dynamic Embedding Quant	SensitivityPruner FPGMFilterPruner L1NormFilterPruner *L2NormFilterPruner SlimFilterPruner *OptSlimFilterPruner	Simulate Anneal based NAS Reinforcement Learning based NAS DARTS PC-DARTS *Once-for-All Hardware-aware Search	FSP DML *DK

注：

*表示仅支持静态图，**表示仅支持动态图
敏感度裁剪指的是通过各个层的敏感度分析来确定各个卷积层的剪裁率，需要和其他裁剪方法配合使用。

效果展示

PaddleSlim在典型视觉和自然语言处理任务上做了模型压缩，并且测试了Nvidia GPU、ARM等设备上的加速情况，这里展示部分模型的压缩效果，详细方案可以参考下面CV和NLP模型压缩方案:

表1: 部分模型压缩加速情况

注:

YOLOv3: 在移动端SD855上加速3.55倍。
PP-OCR: 体积由8.9M减少到2.9M, 在SD855上加速1.27倍。
BERT: 模型参数由110M减少到80M，精度提升的情况下，Tesla T4 GPU FP16计算加速1.47倍。

文档教程

快速开始

快速开始教程是能基于CIFAR10数据集快速运行起来的简单示例，若您是Paddle官方模型套件用户，请直接使用下方的CV模型压缩或者NLP模型压缩中教程。

量化训练 - 动态图 | 静态图
离线量化 - 动态图 | 静态图
剪裁 - 动态图 | 静态图
蒸馏 - 静态图
NAS - 静态图

进阶教程

进阶教程详细介绍了每一步的流程，帮助您把相应方法迁移到您自己的模型上。

通道剪裁
- 四种剪裁策略效果对比与应用方法
- 自定义剪裁策略：动态图
低比特量化
- 三种量化方法介绍与应用
  - 量化训练：动态图 | 静态图
  - 离线量化：动态图 | 静态图
  - embedding量化：静态图
NAS
- 四种NAS策略介绍和应用
  - Once-For-All
  - SANAS
  - RLNAS
  - DARTS
蒸馏
- 知识蒸馏示例

推理部署

CV模型压缩

本系列教程均基于Paddle官方的模型套件中模型进行压缩，若您不是模型套件用户，更推荐使用快速教程和进阶教程。

检测模型压缩
- 压缩方案
  - PPDetection-YOLOv3 压缩方案
- 方法应用-静态图
- 方法应用-动态图
  - 剪枝
  - 量化训练
分割模型压缩
- 压缩方案
- 方法应用-静态图
- 方法应用-动态图
  - 剪枝
  - 量化训练
OCR模型压缩
- 压缩方案
  - 3.5M模型压缩方案
- 方法应用-静态图
  - 量化训练
  - 剪枝
- 方法应用-动态图
  - 剪枝
  - 量化训练

NLP模型压缩

API文档

FAQ

许可证书

本项目的发布受Apache 2.0 license许可认证。

贡献代码

我们非常欢迎你可以为PaddleSlim提供代码，也十分感谢你的反馈。

技术交流

如果你发现任何PaddleSlim存在的问题或者是建议, 欢迎通过GitHub Issues给我们提issues。
欢迎加入PaddleSlim 微信技术交流群（添加并回复小助手“Slim”）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PaddleSlim

简介

版本对齐

安装

最近更新

功能概览

效果展示

文档教程

快速开始

进阶教程

推理部署

CV模型压缩

NLP模型压缩

API文档

FAQ

许可证书

贡献代码

技术交流

About

Releases

Packages

Languages

License

tianbuwei/PaddleSlim

Folders and files

Latest commit

History

Repository files navigation

PaddleSlim

简介

版本对齐

安装

最近更新

功能概览

效果展示

文档教程

快速开始

进阶教程

推理部署

CV模型压缩

NLP模型压缩

API文档

FAQ

许可证书

贡献代码

技术交流

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages