Question

我想知道如何

<input type="text" x-webkit-speech speech />

Chrome中是否内置了语音识别引擎，还是在操作系统中访问基础语音识别工具？

Answer 1

是的，Chrome通过Google的服务器进行语音识别。但是没有其他浏览器不能选择以不同的方式实现它（例如在操作系统中使用一些语音识别工具）。

巴鲁，你的链接实际上已经过时了。最新的Google提案可在此处找到：http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html

虽然Chrome开发频道已经提供语音识别已有一段时间了，但尚未已发货，我们尚不确定它何时发货。我们绝对希望人们使用API并提供反馈，但我们认为它还没有为黄金时间做好准备。

Answer 2

根据代码，它将音频数据作为POST请求发送到：

https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3

lm在代码中为grammar，xhw为hardware_info，根据评论，这是可选的。音频似乎是speex，x-speex-with-header-byte：

// Encode the frame and place the size of the frame as the first byte. This
// is the packet format for MIME type x-speex-with-header-byte.

修改用于您自己的应用程序的chrome代码似乎非常简单。

更新

您还需要获得speech recognition API key，并且每天仅限于50个请求。没有办法增加这个限制 - 甚至不用付钱。

Answer 3

他们使用自己的API进行语音识别。例如：向服务器发送帖子请求。

Answer 4

有一个speexenc的实验分支，可以编码x-speex-with-header-byte MIME二进制格式，它在QXIP Wiki上引用，可在GitHub上获得。通过将帧的大小放在数据包的第一个字节来完成工作。

Answer 5

该功能附带Chrome 8+，看起来它将数据发送到谷歌服务器以执行实际识别。

Answer 6

此功能现在适用于chrome 11 beta。

检查出来..

Answer 7

对于谷歌语音到文本API

，这可能是感兴趣的https://github.com/taf2/speech2text ruby绑定

Answer 8

是的，Chrome确实通过WebKit提供内置语音支持;只需查看Google主页（现在搜索框右侧有麦克风）。不过，我想知道Chrome团队是否正在开发Omnibox语音支持。毕竟，Chrome是基于WebKit的浏览器！

Answer 9

还有一个工作组制作了http://www.w3.org/TR/xhtml+voice/，但我不认为这是在Opera以外的任何浏览器中实现的。

Answer 10

我刚刚在我的Chrome Cr-48上证实了这一点，它确实有用。