EasyInfer

Code to make running model inference easy in different backends. You don't have to worry about input/output names, dtypes and batch size. ONNX and Triton Inference Server are now available.

Quick start

Run run_env.sh for building docker image and run docker container.
In docker environment from example directory run python3.8 prepare_model.py for export resnet18 to onnx with dynamic and static batch size
Out of docker environment from example directory run run_triton.sh for start Triton Inference Server with two exported models
In docker environment from workdir run python3.8 main.py for send batch with size 12 to models with size 8 in triton and onnx format.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
example		example
src		src
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt
run_env.sh		run_env.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

EasyInfer

Quick start

About

Releases

Packages

Languages

TheConstant3/EasyInfer

Folders and files

Latest commit

History

Repository files navigation

EasyInfer

Quick start

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages