我正在开发一个网站,我想帮助盲人用语音来使用它,所以我会用:
我已经有了一些文本到语音的JavaScript库(比如speak.js),但现在我需要一个很好的语音到文本。有一些解决方案用于此目的(如speechapi),但它们使用Java Applet或Flash,我只想依赖JavaScript,以避免插件。
我正在尝试使用x-webkit-speech和Google Chrome进行HTML5的语音输入,这很好,但你需要点击一个图标(盲人不能很好地使用鼠标)。使用x-webkit-speech按键是否可行?你知道任何替代API(JavaScript)吗?
谢谢!
答案 0 :(得分:4)
使用按键的x-webkit-speech是否可行?
根据此post和此post,您无法通过点击麦克风来覆盖语音的开头。
x-webkit-speech正在做的是使用HTML5的音频捕获功能并将音频发送到Google的服务器进行处理,并以JSON格式返回结果。这blogger has reversed engineered it。您可以开发一个JavaScript库,查找按键以开始在支持HTML5的浏览器上捕获音频,并将其发送到Google的服务或您创建的服务。使用Google服务的缺点是它是一个不受支持的API,可能随时更改。开发自己的服务的缺点是开发和维护成本很高。
您知道其他任何API(JavaScript)吗?
此post和此post列出了一些可用于语音识别的服务。我没有看到Nuance上市。您可以使用Dragon Mobile SDK来实现此目的。您可能需要查看ISpeech。
答案 1 :(得分:2)
谷歌翻译是非常好的文本到语音引擎。我曾经用它读过文字。例如,您有一个文本:welcome to Stack overflow
,您可以像这样调用
http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input
然后使用浏览器音频播放
对于语音输入,您可以手动激活收听过程,请参见此处 http://code.google.com/chrome/extensions/experimental.speechInput.html