我想在语音识别期间录制语音。基于对已识别语音的信任,该程序将保存或拒绝用户的语音。
为了做到这一点,我有两个选择:
从浏览器录制用户的语音并发送到Node JS服务器。然后将语音发布到Google Speech API并获取结果。基于置信水平做行动。
在浏览器中识别并记录用户语音。如果识别置信度良好,则将语音发送到Node JS服务器以保存它。
第二种方式似乎很好,但我怎样才能获得用户语音的音频?
注意:语音将是连续的,文本的每个部分都将持续约一分钟。
环境:Google Chrome v49,HTML5(在浏览器端)。节点JS(在服务器端)
感谢您的帮助。
编辑#1(基于@ raju的评论):
我尝试过以下代码
var recognition = new webkitSpeechRecognition();
recognition.continuous = true;
recognition.interimResults = true;
recognition.lang = "tr-TR";
recognition.onresult = function(event) {
console.log(event)
}
recognition.start();
它有效,但它只返回语音识别的结果。我也想要原始声音数据。我查找了不同的事件及其参数"识别"对象,但它们都不符合我的需要。有什么建议吗?