ASR Server 分为两部分:
-
前端服务器:负责接收来自前端的音频数据。
-
后端服务器:负责管理后端的推理节点,并将音频数据发送给推理节点。
npm install
node app.js
JSON:
计算唤醒词的 embedding。
{
"type": "detect",
"words": "小智"
}
二进制:
发送音频 PCM 数据。
JSON:
{
"type": "text",
"text": "你好,小智",
"embedding": [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0],
"url": "http://example.com/audio.ogg"
}