Chrome是否具有“x-webkit-speech”输入元素的内置语音识别功能?

时间:2010-12-05 22:59:05

标签: html5 google-chrome webkit speech-recognition

我想知道如何

<input type="text" x-webkit-speech speech />

Chrome中是否内置了语音识别引擎,还是在操作系统中访问基础语音识别工具?

10 个答案:

答案 0 :(得分:13)

是的,Chrome通过Google的服务器进行语音识别。但是没有其他浏览器不能选择以不同的方式实现它(例如在操作系统中使用一些语音识别工具)。

巴鲁,你的链接实际上已经过时了。最新的Google提案可在此处找到:http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html

虽然Chrome开发频道已经提供语音识别已有一段时间了,但尚未已发货,我们尚不确定它何时发货。我们绝对希望人们使用API​​并提供反馈,但我们认为它还没有为黄金时间做好准备。

答案 1 :(得分:9)

根据代码,它将音频数据作为POST请求发送到:

https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3

lm在代码中为grammarxhwhardware_info,根据评论,这是可选的。音频似乎是speex,x-speex-with-header-byte:

// Encode the frame and place the size of the frame as the first byte. This
// is the packet format for MIME type x-speex-with-header-byte.

修改用于您自己的应用程序的chrome代码似乎非常简单。

更新

您还需要获得speech recognition API key,并且每天仅限于50个请求。没有办法增加这个限制 - 甚至不用付钱。

答案 2 :(得分:6)

他们使用自己的API进行语音识别。例如:向服务器发送帖子请求。

答案 3 :(得分:6)

有一个speexenc的实验分支,可以编码x-speex-with-header-byte MIME二进制格式,它在QXIP Wiki上引用,可在GitHub上获得。通过将帧的大小放在数据包的第一个字节来完成工作。

答案 4 :(得分:2)

语音识别是Google提出的一项提案。 https://docs.google.com/View?id=dcfg79pz_5dhnp23f5

该功能附带Chrome 8+,看起来它将数据发送到谷歌服务器以执行实际识别。

答案 5 :(得分:2)

此功能现在适用于chrome 11 beta。

检查出来..

http://slides.html5rocks.com/#speech-input

答案 6 :(得分:2)

对于谷歌语音到文本API

,这可能是感兴趣的https://github.com/taf2/speech2text ruby​​绑定

答案 7 :(得分:1)

是的,Chrome确实通过WebKit提供内置语音支持;只需查看Google主页(现在搜索框右侧有麦克风)。不过,我想知道Chrome团队是否正在开发Omnibox语音支持。毕竟,Chrome是基于WebKit的浏览器!

答案 8 :(得分:0)

还有一个工作组制作了http://www.w3.org/TR/xhtml+voice/,但我不认为这是在Opera以外的任何浏览器中实现的。

答案 9 :(得分:0)

我刚刚在我的Chrome Cr-48上证实了这一点,它确实有用。