浏览器

时间:2018-03-25 07:06:49

标签: tensorflow speech-recognition speech-to-text google-speech-api

我正在开发一种产品,需要从用户那里获取输入并根据它进行某些操作。我们通过打字通过聊天框实现了它,它正在服务于我们的目的。对于将来的版本,我们希望在聊天窗口中添加语音识别功能。我们想过使用

  

window.speechRecognition()|| window.webkitSpeechRecognition()

但我们发现浏览器中功能可用的是Google的Cloud Speech API。当我们处理用户非常敏感的信息时,这将是安全问题。是否有其他替代方法可用于实现适用于任何浏览器的语音识别。

4 个答案:

答案 0 :(得分:2)

您可以尝试:

  • Snowboy,服务器中没有存储任何wav。他们为训练NN 您可以下载模型的权重。
  • Tensorflow:真的 很好,但是这需要您做一些工作。成功的项目 TTS的DeepSpeech和相关。

答案 1 :(得分:0)

显然,PocketSphinx.js是到目前为止唯一可用的方法。这是一个开放源代码的语音转文本引擎,支持英语,但仅支​​持英语。

Github:

但是,如果您要在Android设备的单个实例(例如,显示在公共区域中的设备)上运行代码,则可以在移动Chrome的设置中使用“下载离线语音识别语言”。桌面浏览器没有此类选项。

答案 2 :(得分:0)

使用tensorflowjs“ tfjs”模型可以在浏览器中使用最明智的解决方案

  

语音命令识别器语音命令识别器是一种   JavaScript模块可识别语音命令   由少量词汇组成的简单的孤立英语单词组成

答案 3 :(得分:-1)

您可以尝试使用IBM Watson的Speech To Text服务。它可以在任何浏览器中使用,您可以选择退出,这样用户的数据就不会记录在服务器端:https://console.bluemix.net/docs/services/watson/getting-started-logging.html#controlling-request-logging-for-watson-services

该服务的演示位于:https://speech-to-text-demo.ng.bluemix.net/

至少在Firefox和Chrome中有效,它基于以下开源SDK:https://github.com/watson-developer-cloud/speech-javascript-sdk

PS。对于一般情况,当用户的数据不敏感时,最好不要选择退出,以便Watson可以利用这些数据来提高服务质量。