From 77c4de0c306dceecae7ce64867053d96d9e18923 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E9=AB=98=E5=9D=9A=E6=9E=9C?= <753610399@qq.com> Date: Sun, 8 May 2022 14:48:06 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0=E6=96=87=E6=A1=A3?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 5 +++++ .../teach.realtime.asr.aliyun.short.js | 8 +++++++- assets/zdemo.index.asr.js | 16 +++++++++++++--- 3 files changed, 25 insertions(+), 4 deletions(-) diff --git a/README.md b/README.md index ba9fb67..a14b4da 100644 --- a/README.md +++ b/README.md @@ -1004,6 +1004,11 @@ anyData: any 具体类型取决于: > 本插件单次语音识别时虽长无限制,最佳使用场景还是1-5分钟内的语音识别;60分钟以上的语音识别本插件也能胜任(需自行进行重试容错处理),但太长的识别场景不太适合使用阿里云一句话识别(阿里云单次一句话识别最长60秒,本插件自带拼接过程,所以无时长限制);为什么采用一句话识别:因为便宜。 +> 【关于腾讯云版的对接说明】 +> 腾讯云一句话语音识别(不支持实时特性),前端基本上没有什么需要做的,仅需让后端提供一个录音文件上传接口(很容易),前端将录制好1分钟内的语音文件直接上传给服务器,由后端调用腾讯云语一句话音识别接口,然后返回结果即可。暂不提供插件、测试代码。 +> +> 相较于阿里云的一句话语音识别:前端直接对接阿里云很容易(后端对接会很难,音频数据前端直连阿里云,无需走后端),后端对接腾讯云很容易(前端无法直连腾讯云,音频数据必须走后端);根据自己的业务需求选择合适的云进行对接,避免多走弯路。 + ### 对接流程 1. 到阿里云开通 一句话识别 服务(可试用一段时间,正式使用时应当开通商用版,很便宜),得到AccessKey、Secret,参考:https://help.aliyun.com/document_detail/324194.html ; 2. 到阿里云智能语音交互控制台创建相应的语音识别项目,并配置好项目,得到Appkey,每个项目可以设置一种语言模型,要支持多种语言就创建多个项目; diff --git a/assets/runtime-codes/teach.realtime.asr.aliyun.short.js b/assets/runtime-codes/teach.realtime.asr.aliyun.short.js index 3e614fe..bd3f76b 100644 --- a/assets/runtime-codes/teach.realtime.asr.aliyun.short.js +++ b/assets/runtime-codes/teach.realtime.asr.aliyun.short.js @@ -6,6 +6,12 @@ 通过阿里云语音识别(语音转文字)插件 /src/extensions/asr.aliyun.short.js,可实现实时语音识别、单个语音文件转文字。 只需要后端提供一个Token生成接口,就能进行语音识别,可直接参考或本地运行此NodeJs后端测试程序:/assets/demo-asr/NodeJsServer_asr.aliyun.short.js,配置好代码里的阿里云账号后,在目录内直接命令行执行`node NodeJsServer_asr.aliyun.short.js`即可运行提供本地测试接口。 + +-------------------- +【关于腾讯云版的对接说明】 +腾讯云一句话语音识别(不支持实时特性),前端基本上没有什么需要做的,仅需让后端提供一个录音文件上传接口(很容易),前端将录制好1分钟内的语音文件直接上传给服务器,由后端调用腾讯云语一句话音识别接口,然后返回结果即可。暂不提供插件、测试代码。 + +相较于阿里云的一句话语音识别:前端直接对接阿里云很容易(后端对接会很难,音频数据前端直连阿里云,无需走后端),后端对接腾讯云很容易(前端无法直连腾讯云,音频数据必须走后端);根据自己的业务需求选择合适的云进行对接,避免多走弯路。 ******************/ var asr; @@ -263,7 +269,7 @@ var killToken=function(){ Runtime.Log("已设置ASR的apiRequest,下一分钟将无法获得Token"); }; var killWs=function(){ - if(!asr && !asr.wsCur){ + if(!asr || !asr.wsCur){ Runtime.Log("未开始语音识别",1); return; } diff --git a/assets/zdemo.index.asr.js b/assets/zdemo.index.asr.js index 9c8c528..684c0af 100644 --- a/assets/zdemo.index.asr.js +++ b/assets/zdemo.index.asr.js @@ -43,17 +43,27 @@ $(".asrView").html('
\ \
\
实时识别结果:
\ -
\ +
\
\ \ \
\ - 音频文件转文字\ + 音频文件转文字 [阿里云版] - /src/extensions/asr.aliyun.short.js\
\ -
\ +
\ \
\ \ +
\ + 实时语音识别 [腾讯云版] [其他云]\ +
\ +
\ + 腾讯云一句话语音识别(不支持实时特性),前端基本上没有什么需要做的,仅需让后端提供一个录音文件上传接口(很容易),前端将录制好1分钟内的语音文件直接上传给服务器,由后端调用腾讯云语一句话音识别接口,然后返回结果即可。暂不提供插件、测试代码。\ +
\ + 相较于阿里云的一句话语音识别:前端直接对接阿里云很容易(后端对接会很难,音频数据前端直连阿里云,无需走后端),后端对接腾讯云很容易(前端无法直连腾讯云,音频数据必须走后端);根据自己的业务需求选择合适的云进行对接,避免多走弯路。\ +
\ +
\ +\
'); recAsrStatus("请先在上面打开录音得到权限后再来语音识别哦~","#ccc");