Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
app.js		app.js
config.js		config.js
ecosystem.config.js		ecosystem.config.js
manager.js		manager.js
package.json		package.json
worker.js		worker.js

README.md

ASR Server

简介

ASR Server 分为两部分：

前端服务器：负责接收来自前端的音频数据。
后端服务器：负责管理后端的推理节点，并将音频数据发送给推理节点。

安装

npm install
node app.js

前端 WebSocket 协议

唤醒词声纹检测

计算唤醒词的 embedding。

{
  "type": "listen",
  "state": "detect",
  "text": "你好小智"
}

语音识别

启动流式语音识别，auto 为自动应答，manual 为手动应答。

{
  "type": "listen",
  "state": "start",
  "mode": "auto"
}

结束语音识别（仅手动应答）

{
  "type": "listen",
  "state": "stop"
}

发送音频 PCM 数据

通过 WebSocket 的二进制通道发送音频 PCM 数据。

识别结果

JSON：

{
  "type": "text",
  "text": "你好，小智",
  "embedding": [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0],
  "url": "http://example.com/audio.ogg"
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

asr-server

asr-server

README.md

ASR Server

简介

安装

前端 WebSocket 协议

唤醒词声纹检测

语音识别

结束语音识别（仅手动应答）

发送音频 PCM 数据

识别结果

Files

asr-server

Directory actions

More options

Directory actions

More options

Latest commit

History

asr-server

Folders and files

parent directory

README.md

ASR Server

简介

安装

前端 WebSocket 协议

唤醒词声纹检测

语音识别

结束语音识别（仅手动应答）

发送音频 PCM 数据

识别结果