Question

我正在开发一个网站，我想帮助盲人用语音来使用它，所以我会用：

文字转语音，为用户提供一些可能性
语音转文字，允许用户使用自己的语音选择一个

我已经有了一些文本到语音的JavaScript库（比如speak.js），但现在我需要一个很好的语音到文本。有一些解决方案用于此目的（如speechapi），但它们使用Java Applet或Flash，我只想依赖JavaScript，以避免插件。

我正在尝试使用x-webkit-speech和Google Chrome进行HTML5的语音输入，这很好，但你需要点击一个图标（盲人不能很好地使用鼠标）。使用x-webkit-speech按键是否可行？你知道任何替代API（JavaScript）吗？

谢谢！

Answer 1

使用按键的x-webkit-speech是否可行？

根据此post和此post，您无法通过点击麦克风来覆盖语音的开头。

x-webkit-speech正在做的是使用HTML5的音频捕获功能并将音频发送到Google的服务器进行处理，并以JSON格式返回结果。这blogger has reversed engineered it。您可以开发一个JavaScript库，查找按键以开始在支持HTML5的浏览器上捕获音频，并将其发送到Google的服务或您创建的服务。使用Google服务的缺点是它是一个不受支持的API，可能随时更改。开发自己的服务的缺点是开发和维护成本很高。

您知道其他任何API（JavaScript）吗？

此post和此post列出了一些可用于语音识别的服务。我没有看到Nuance上市。您可以使用Dragon Mobile SDK来实现此目的。您可能需要查看ISpeech。

Answer 2

谷歌翻译是非常好的文本到语音引擎。我曾经用它读过文字。例如，您有一个文本：welcome to Stack overflow，您可以像这样调用

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input

然后使用浏览器音频播放

对于语音输入，您可以手动激活收听过程，请参见此处 http://code.google.com/chrome/extensions/experimental.speechInput.html

针对盲人的JavaScript语音转文本

2 个答案: