Name		Name	Last commit message	Last commit date
parent directory ..
docs		docs
scripts		scripts
src		src
CMakeLists.txt		CMakeLists.txt
Dockerfile		Dockerfile
Dockerfile_cpu		Dockerfile_cpu
Dockerfile_ipu		Dockerfile_ipu
README.md		README.md
README_CN.md		README_CN.md
README_EN.md		README_EN.md

README.md

简体中文 | English

FastDeploy 服务化部署

简介

FastDeploy基于Triton Inference Server搭建了端到端的服务化部署。底层后端使用FastDeploy高性能Runtime模块，并串联FastDeploy前后处理模块实现端到端的服务化部署。具有快速部署、使用简单、性能卓越的特性。

准备环境

环境要求

Linux
如果使用GPU镜像，要求NVIDIA Driver >= 470(如果是旧的Tesla架构GPU，如T4使用的NVIDIA Driver可以是418.40+、440.33+、450.51+、460.27+)

获取镜像

CPU镜像

CPU镜像仅支持Paddle/ONNX模型在CPU上进行服务化部署，支持的推理后端包括OpenVINO、Paddle Inference和ONNX Runtime

docker pull paddlepaddle/fastdeploy:1.0.0-cpu-only-21.10

GPU镜像

GPU镜像支持Paddle/ONNX模型在GPU/CPU上进行服务化部署，支持的推理后端包括OpenVINO、TensorRT、Paddle Inference和ONNX Runtime

docker pull paddlepaddle/fastdeploy:1.0.0-gpu-cuda11.4-trt8.4-21.10

用户也可根据自身需求，参考如下文档自行编译镜像

FastDeploy服务化部署镜像编译说明

其它文档

模型仓库目录说明 (说明如何准备模型仓库目录)
模型配置说明 (说明runtime的配置选项)
服务化部署示例 (服务化部署示例)

服务化部署示例

任务场景	模型
Classification	PaddleClas
Detection	PaddleDetection
Detection	ultralytics/YOLOv5
NLP	PaddleNLP/ERNIE-3.0
NLP	PaddleNLP/UIE
Speech	PaddleSpeech/PP-TTS
OCR	PaddleOCR/PP-OCRv3

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

serving

serving

README.md

FastDeploy 服务化部署

简介

准备环境

环境要求

获取镜像

CPU镜像

GPU镜像

其它文档

服务化部署示例

Files

serving

Directory actions

More options

Directory actions

More options

Latest commit

History

serving

Folders and files

parent directory

README.md

FastDeploy 服务化部署

简介

准备环境

环境要求

获取镜像

CPU镜像

GPU镜像

其它文档

服务化部署示例