pytorch自动化模型压缩工具库

介绍

pytorch自动化模型压缩工具库是针对于pytorch模型的基于ONNX静态图结构分析的自动化模型压缩工具库，用户无需理解模型的结构，即可以直接对模型完成剪枝和查找替换等操作，所有的剪枝参数分析和修改以及模块结构搜索均由该工具完成。
工具库包含有两个部分，第一个部分为torchpruner模型分析与修改工具库，通过该工具库可以自动对模型完成模块修改和通道修改等常规操作，而无需关注模型的结构细节。
第二个部分为torchslim模型压缩算法库，包含了模型重参数化、剪枝、感知量化训练等多种模型压缩算法，用户仅需给出需要被压缩的模型并定义好用于训练的hook函数，即可以对模型进行自动压缩，并输出被压缩模型产物。

requirement

onnx>=1.6
onnxruntime>=1.5
pytorch>=1.7
tensorboardX>=1.8
scikit-learn

安装

python setup.py install

总揽

torchpruner

torchpruner为pytorch模型分析与修改工具库，包含了以下功能：
1）自动分析模型结构和剪枝
2）特定模型结构查找与替换

torchslim

torchslim内包含了模型压缩的特定算法：
1）ACNet重参数化方法
2）ResRep模型剪枝方法
3）CSGD模型剪枝方法
4）QAT量化感知训练，并将pytorch模型导出为tenosrrt模型

examples

examples文件夹主要包含了多种支持的模型的测试列表support_model，torchpruner工具库的使用示例以及torchslim工具库的使用示例。
1）support_model：支持的若干种模型
2）torchpruner：使用torchpruner剪枝和模块修改的简单示例
3）torchslim：使用torchslim 在分类模型上的简单示例

torchpruner模型修改

import torch
import torchpruner
import torchvision
#加载模型
model=torchvision.models.resnet50()

#创建ONNXGraph对象，绑定需要被剪枝的模型
graph=torchpruner.ONNXGraph(model)
##build ONNX静态图结构，需要指定输入的张量
graph.build_graph(inputs=(torch.zeros(1,3,224,224),))

#获取conv1模块对应的module
conv1_module=graph.modules['self.conv1']
#剪枝分析
result=conv1_module.cut_analysis(attribute_name='weight',index=[0,1,2,3],dim=0)
#执行剪枝操作
model,context=torchpruner.set_cut(model,result)
#对卷积模块进行剪枝操作

torchslim模型压缩

import torchslim

#predict_function的第一个参数为model，第二个参数为一个batch的data,data已经被放置到了GPU上
config['task_name']='resnet56_prune'
config['epoch']=90
config['lr']=0.1
config['prune_rate']=0.5
config['save_path']="model/save/path"
config['dataset_generator']=dataset_generator
config['predict_function']=predict_function
config['evaluate_function']=evaluate_function
config['calculate_loss_function']=calculate_loss_function

model=torch.load("model/path")

#创建solver
solver=torchslim.pruning.resrep.ResRepSolver(model,config)
#执行压缩
solver.run()

使用说明

常规用法见
examples
详细使用说明见各自文件夹README.md
torchpruner
torchslim

支持模型结构

该工具理论上支持所有复杂结构模型的剪枝操作，然而由于精力有限，仅有部分的模型和结构被测试，其他模型和结构不代表不支持，但未测试。

已测试常用模型

AlexNet
VGGNet系列
ResNet系列
MobileNet系列
ShuffleNet系列
Inception系列
MNASNet系列
Unet系列
FCN
DeepLab V3
ResNet/Unet QAT感知量化训练模型(QDQ节点)

已测试常用结构和操作

Conv/Group Conv/TransposeConv/FC
Pooling/Upsampling
BatchNorm
Relu/Sigmoid
concat/transpose/view
残差结构/倒置残差结构/Inception结构/Unet结构
quantize_per_tensor/dequantize_per_tensor

确定暂不支持模型

FasterRCNN/MaskRCNN

未来重点测试和支持的模型和结构

RNN/LSTM/GRU
Transformer
FasterRCNN

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

pytorch自动化模型压缩工具库

介绍

requirement

安装

总揽

torchpruner

torchslim

examples

torchpruner模型修改

torchslim模型压缩

使用说明

支持模型结构

已测试常用模型

已测试常用结构和操作

确定暂不支持模型

未来重点测试和支持的模型和结构

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
examples		examples
torchpruner		torchpruner
torchslim		torchslim
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
setup.py		setup.py

License

Ocean-627/torch-model-compression

Folders and files

Latest commit

History

Repository files navigation

pytorch自动化模型压缩工具库

介绍

requirement

安装

总揽

torchpruner

torchslim

examples

torchpruner模型修改

torchslim模型压缩

使用说明

支持模型结构

已测试常用模型

已测试常用结构和操作

确定暂不支持模型

未来重点测试和支持的模型和结构

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages