Skip to content

Latest commit

 

History

History
 
 

asr-server

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 

ASR Server

简介

ASR Server 分为两部分:

  1. 前端服务器:负责接收来自前端的音频数据。

  2. 后端服务器:负责管理后端的推理节点,并将音频数据发送给推理节点。

安装

npm install
node app.js

前端 WebSocket 协议

唤醒词声纹检测

计算唤醒词的 embedding。

{
  "type": "listen",
  "state": "detect",
  "text": "你好小智"
}

语音识别

启动流式语音识别,auto 为自动应答,manual 为手动应答。

{
  "type": "listen",
  "state": "start",
  "mode": "auto"
}

结束语音识别(仅手动应答)

{
  "type": "listen",
  "state": "stop"
}

发送音频 PCM 数据

通过 WebSocket 的二进制通道发送音频 PCM 数据。

识别结果

JSON:

{
  "type": "text",
  "text": "你好,小智",
  "embedding": [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0],
  "url": "http://example.com/audio.ogg"
}