我想知道如何
<input type="text" x-webkit-speech speech />
Chrome中是否内置了语音识别引擎,还是在操作系统中访问基础语音识别工具?
答案 0 :(得分:13)
是的,Chrome通过Google的服务器进行语音识别。但是没有其他浏览器不能选择以不同的方式实现它(例如在操作系统中使用一些语音识别工具)。
巴鲁,你的链接实际上已经过时了。最新的Google提案可在此处找到:http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html虽然Chrome开发频道已经提供语音识别已有一段时间了,但尚未已发货,我们尚不确定它何时发货。我们绝对希望人们使用API并提供反馈,但我们认为它还没有为黄金时间做好准备。
答案 1 :(得分:9)
根据代码,它将音频数据作为POST请求发送到:
https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3
lm
在代码中为grammar
,xhw
为hardware_info
,根据评论,这是可选的。音频似乎是speex,x-speex-with-header-byte:
// Encode the frame and place the size of the frame as the first byte. This
// is the packet format for MIME type x-speex-with-header-byte.
修改用于您自己的应用程序的chrome代码似乎非常简单。
更新
您还需要获得speech recognition API key,并且每天仅限于50个请求。没有办法增加这个限制 - 甚至不用付钱。
答案 2 :(得分:6)
他们使用自己的API进行语音识别。例如:向服务器发送帖子请求。
答案 3 :(得分:6)
有一个speexenc的实验分支,可以编码x-speex-with-header-byte MIME二进制格式,它在QXIP Wiki上引用,可在GitHub上获得。通过将帧的大小放在数据包的第一个字节来完成工作。
答案 4 :(得分:2)
语音识别是Google提出的一项提案。 https://docs.google.com/View?id=dcfg79pz_5dhnp23f5
该功能附带Chrome 8+,看起来它将数据发送到谷歌服务器以执行实际识别。
答案 5 :(得分:2)
答案 6 :(得分:2)
对于谷歌语音到文本API
,这可能是感兴趣的https://github.com/taf2/speech2text ruby绑定答案 7 :(得分:1)
是的,Chrome确实通过WebKit提供内置语音支持;只需查看Google主页(现在搜索框右侧有麦克风)。不过,我想知道Chrome团队是否正在开发Omnibox语音支持。毕竟,Chrome是基于WebKit的浏览器!
答案 8 :(得分:0)
还有一个工作组制作了http://www.w3.org/TR/xhtml+voice/,但我不认为这是在Opera以外的任何浏览器中实现的。
答案 9 :(得分:0)
我刚刚在我的Chrome Cr-48上证实了这一点,它确实有用。