AI Service Engine

背景

引擎托管平台（AI Service Engine）是一个专为AI能力开发者打造的AI算法引擎的无服务全托管式平台，您可以通过集成ASE中提供的插件，快速的部署AI算法引擎，并使用网络、分发策略、数据处理等配套辅助系统。引擎托管平台致力于加速AI算法引擎云服务化，并借助云原生架构，为云服务的稳定提供多重保障，您无需关注底层基础设施及服务化相关的开发、治理和运维，即可高效、安全对引擎进行部署、升级、扩缩、运营和监控。

整体架构

使用工作流

开源计划

任务项	目标	时间
☑ 加载器通用引擎/模型加载器	独立部署可运行，支持python快速推理服务化	2022/Q2
☑ 负载均衡器负载聚合组件	独立部署可运行	2022/Q3
☐ WebGate Web网关组件	可运行	2022/Q3
☑ Polaris 配置中心与服务发现	独立部署可运行	2022/Q2
☐ Atom 协议转换组件	可运行	2022/Q3
☐ Serving on Kubernetes Helm Chart一键部署 (进行中)	支持在k8s集群上一键部署推理服务框架	2022/Q3
☐ Serving on Docker with docker-compose 一键部署	支持使用docker-compose部署推理服务框架	2022/Q4
☐ 各组件Documentation建设 (进行中)	各组件文档详设，门户建设	2022/Q4
☐ 多领域模型Demo演示示例、GIF (进行中)	部分领域模型推理示例，如mmdetection,mmocr,yolo等	2022/Q3
☐ AIServing API AI能力协议规范	完善开源协议说明，schema自动生成、校验工具	2022/Q3
☐ AseCTl命令行工具 API 命令行工具	支持能力一键生成，运行，配置管理等	2022/Q4

使用说明

AIGES (AI General Engine Service)

通用引擎加载器(部分文档中loader， loader engine均代表加载器)

AIGES 项目编译
```
make
```
AIGES 项目打包
```
make build-pack
```
AIGES 清理项目文件
```
make clean
```

Polaris是使用Go编写的服务发现、配置中心

官方文档

Features

☑ 支持模型推理成RPC服务(Serving框架会转成HTTP服务)

☑ 支持C代码推理 support c++/c code infer

☑ 支持Python代码推理 Support python code infer

☑ 支持配置中心，服务发现

☑ 支持负载均衡配置

☐ 支持Java代码推理或者其它

☐ 支持计量授权

协议

参见: ase-proto

开源版docker镜像

基础镜像

基础镜像中提供

基础的编译好的 Python加载器AIService(包含支持python的libwrapper.so), 目录结构如下

加载器默认放置于容器/home/aiges目录

root@e38a9aacc355:/home/aiges# pwd
/home/aiges
root@e38a9aacc355:/home/aiges# ls -l /home/aiges/
total 18760
-rwxr-xr-x 1 root root 19181688 Jun 10 15:30 AIservice
-rw-r--r-- 1 root root     2004 Jun 10 18:15 aiges.toml
drwxr-xr-x 3 root root     4096 Jun 10 15:30 include
drwxrwxrwx 1 root root     4096 Jun 10 15:31 library
drwxr--r-- 2 root root     4096 Jun 10 18:16 log
-rw-r--r-- 1 root root       96 Jun 10 18:15 start_test.sh
drwxr-xr-x 2 root root     4096 Jun 10 18:16 xsf_status
drwxr-xr-x 2 root root     17711057 Jun 10 18:16 xtest
-rw-r--r-- 1 root root     4232 Jun 10 17:54 xtest.toml

其中aiges.toml用于本地启动测试使用

Python环境: 不推荐用户后续镜像构建修改Python版本

业务镜像

业务镜像一般需要用户自己编写Dockerfile构建，业务镜像中用户可以根据场景需要定制安装

推理运行时，如onnxruntime、torchvision等
gpu驱动，cuda，cudnn等驱动

示例Dockerfile地址为

注意事项

插件wrapper.py 当前只支持非流式

更新(2022.8.1)

示例已经提供gpu runtime安装方法

Python加载器插件V2

本地安装或者更新aiges

# 安装aiges
pip install aiges -i https://pypi.python.org/simple
# 更新aiges
pip install --upgrade aiges -i https://pypi.python.org/simple

快速开始一个Python加载器插件项目
```
python -m aiges create -n  "project" 
```
该指令生成一个 "project" 文件夹，并包含wrapper.py的半成品
添加项目内依赖，完善wrapper.py的编写，完成本地调试
- 实现Wrapper类时，必须继承WrapperBase类
- 运行中用到的参数，将变量声明为类变量。为了模拟AIservice传递参数，在Wrapper类中声明一个类成员config用于初始化
- wrapperOnceExec函数执行返回的类型是Response对象，而不是通常表示执行状态错误码的int类型，意味着无论结果正常与否，均需实例化Response对象并返回
```
res = Response()
```
  1. 未出现异常时，Response对象是是由一个或多个ResponseData对象构成的列表
```
l = ResponseData()
l.key = "output_text"
l.status = aiges.dto.Once
l.len = len(r.text.encode())
l.data = r.text
l.type = aiges.dto.TextData
res.list = [l]
# multi data: res.list = [l1, l2, l3]
return res
```
  2. 出现异常时，直接调用Response对象的response_err方法返回错误码
```
return res.response_err(ERROR_CODE)
```

额外声明用户请求和用户响应两个类 用户请求类的StringParamField、NumberParamField、BooleanParamField和IntegerParamField类型模拟了wrapperOnceExec中的params参数，通过key获取value

用户请求类的ImageBodyField、StringBodyField和AudioBodyField字段模拟了wrapperOnceExec中的reqdata参数，通过reqData.get(key)方式获取到这个 body 的结构

class UserRequest(object):
   '''
   定义请求类:
   params:  params 开头的属性代表最终HTTP协议中的功能参数parameters部分， 对应的是   xtest.toml中的parameter字段
            params Field支持 StringParamField，
            NumberParamField，BooleanParamField,IntegerParamField，每个字段均支持枚举
            params 属性多用于协议中的控制字段，请求body字段不属于params范畴

   input:    input字段多用与请求数据段，即body部分，当前支持 ImageBodyField、 StringBodyField和AudioBodyField
   '''
   params1 = StringParamField(key="mode", enums=["music", "humming"], value='humming')

   input1 = AudioBodyField(key="data", path="/home/wrapper/test.wav")
   
class UserResponse(object):
   '''
   定义响应类:
   accepts:  accepts代表响应中包含哪些字段, 以及数据类型

   input:    input字段多用与请求数据段，即body部分，当前支持 ImageBodyField, StringBodyField, 和AudioBodyField
   '''
   accept1 = StringBodyField(key="ouput_text")

实例化用户请求和用户响应对象

class Wrapper(WrapperBase):
   # 实例化用户请求类和用户响应类
   requestCls = UserRequest()
   responseCls = UserResponse()
   ......

声明main函数，实例化Wrapper对象，运行程序

if __name__ == '__main__':
   m = Wrapper()
   m.schema()
   m.run()

理论上用户除了上传 wrapper.py 以及相关依赖之外，还需要提供一些模型文件，这些文件比较大，一般不在Dockerfile中构建入镜像，会导致git代码库十分庞大,当前示例的的yolov5和 mmocr均在 wrapper init的时候下载模型

建议统一方式模型资源使用方式，根据不同场景支持

用户下载模型，比如用户在代码wrapper_init中下载模型，需要用户提前准备好模型下载链接
平台提前挂载资源到指定目录如 /models，需要用户提前上传

基础镜像构建(GPU)

基础镜像仅在特殊需求时(如对cuda，python版本有要求时才需要重新构建,一般用户仅需关注构建业务镜像)

cuda-go-python基础镜像,用于编译aiges项目的基础镜像，参见官方仓库，本仓库引用了部分版本，存放于 docker/gpu/cuda中基础镜像当前基于 nvidia/cuda 官方的基础镜像作为base镜像如 cuda-10.1中所示: aiges基础镜像基于 形如 nvidia/cuda:10.1-devel-ubuntu18.04 构建
基于 cuda-10.1 已构建出public.ecr.aws/iflytek-open/aiges-gpu:10.1-1.17-3.9.13-ubuntu1804-v2.0.0-rc6
aiges: 基于 aiges-dockerifle目录中不同CUDA版本的Dockerfile构建aiges基础镜像

构建命令:

docker buildx build -f docker/gpu/base/cuda-10.2/Dockerfile -t artifacts.iflytek.com/docker-private/atp/cuda-go-python-base:10.2-1.17-3.9.13-ubuntu1804  . --push

当前支持的cuda-go-python基础镜像列表(包含cuda-go-python编译环境)

当前支持的aiges基础镜像列表

构建命令:

使用buildx:

docker buildx build  -f docker/gpu/aiges/ubuntu1804/Dockerfile . -t artifacts.iflytek.com/docker-private/atp/aiges-gpu:10.1-3.9.13-ubuntu1804

使用docker build

docker buildx build  -f docker/gpu/aiges/ubuntu1804/Dockerfile . -t artifacts.iflytek.com/docker-private/atp/aiges-gpu:10.1-3.9.13-ubuntu1804

使用buildah

buildah build  -f docker/gpu/aiges/ubuntu1804/Dockerfile . -t artifacts.iflytek.com/docker-private/atp/aiges-gpu:10.1-3.9.13-ubuntu1804

业务镜像构建方法

业务镜像需要基于 aiges基础镜像进行构建，用户可在此过程定制 python的依赖项目以及用户自研项目

参考示例:

YOLOV5

build.py使用

TODO 计划开发build.py 支持多cuda版本多python版本的基础镜像自动构建pipeline

Name		Name	Last commit message	Last commit date
Latest commit History 221 Commits
.github		.github
ai_cpython_wrapper @ 1365bea		ai_cpython_wrapper @ 1365bea
aiges_demo @ f5061b3		aiges_demo @ f5061b3
buffer		buffer
catch		catch
cgo		cgo
codec		codec
conf		conf
doc/design		doc/design
docker		docker
dp		dp
env		env
frame		frame
hack/release		hack/release
instance		instance
main		main
protocol		protocol
service		service
storage		storage
test		test
utils		utils
vendor		vendor
widget		widget
xtest		xtest
.gitignore		.gitignore
.gitlab-ci.yml		.gitlab-ci.yml
.gitmodules		.gitmodules
.goreleaser.yml		.goreleaser.yml
Dockerfile		Dockerfile
Dockerfile_bullseye		Dockerfile_bullseye
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
clean.sh		clean.sh
go.mod		go.mod
go.sum		go.sum

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI Service Engine

背景

整体架构

使用工作流

开源计划

使用说明

AIGES (AI General Engine Service)

AIGES 项目编译

AIGES 项目打包

AIGES 清理项目文件

Polaris是使用Go编写的服务发现、配置中心

Features

协议

开源版docker镜像

基础镜像

业务镜像

注意事项

更新(2022.8.1)

建议统一方式模型资源使用方式，根据不同场景支持

基础镜像构建(GPU)

业务镜像构建方法

build.py使用

About

Releases

Packages

Languages

License

sea-wyq/aiges

Folders and files

Latest commit

History

Repository files navigation

AI Service Engine

背景

整体架构

使用工作流

开源计划

使用说明

AIGES (AI General Engine Service)

AIGES 项目编译

AIGES 项目打包

AIGES 清理项目文件

Polaris是使用Go编写的服务发现、配置中心

Features

协议

开源版docker镜像

基础镜像

业务镜像

注意事项

更新(2022.8.1)

建议统一方式模型资源使用方式， 根据不同场景支持

基础镜像构建(GPU)

业务镜像构建方法

build.py使用

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

建议统一方式模型资源使用方式，根据不同场景支持

Packages