应用错误收集

在Chrome中自动执行语音输入录制

时间：2011-10-13 08:07:11

标签： google-chrome speech-recognition speech

我正在尝试在Google speech input中自动录制语音（仅适用于Chrome）。

实际上，用户必须单击麦克风才能开始录制，但我正在进行用户不与计算机交互的安装。因此，我必须以其他方式触发录音。

似乎您无法通过代码访问语音输入功能，即您无法调用函数来开始录制。所以现在我正在考虑在麦克风上模拟鼠标点击我尝试过使用javaScript，但似乎只有事件和事件处理程序受到影响（例如，输入字段上的模拟点击会触发其点击处理程序，但不会将焦点放在该字段上。）

所以现在我正在考虑模拟Windows系统鼠标点击，我发现一些可以做到这一点的程序（主要是间隔时间）并且它可以工作，录制开始。但问题是我必须从浏览器应用程序激活点击模拟到目前为止最好的赌注是AutoHotkey，它可以让你创建自定义脚本，在我的例子中是一个模拟给定位置鼠标点击的脚本。所以，如果我可以从浏览器执行这个脚本，我会很安全，但我不知道怎么做。

欢迎任何想法和/或想法！

2 个答案:

答案 0 :(得分：0)

我遇到了类似的问题。我们想要开始和停止录制，以测试google api在德语中使用语音识别的效果。但还没有找到解决方案。

html5功能仍然有限，仅适用于五个输入字段。也许你在这里找到一些信息： http://lists.w3.org/Archives/Public/public-xg-htmlspeech/2011Feb/att-0020/api-draft.html 我们明天回到这个话题。

答案 1 :(得分：0)

我遇到了类似的问题，然后我看了Mike Pultz的这个网站 -

http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/

基本上，他所做的是他自己创建音频文件，使用Sox将其转换为.flac格式，然后将其发送到Google Voice Api。因此，您无需单击麦克风，或者您可以创建自己的麦克风回叫。

我还在 - https://github.com/seigneur/Voice-Biometrics创建了一个C＃解决方案您可以查看此视频以获取进一步的帮助 - http://www.youtube.com/watch?v=PA00SPOTL-M

希望有所帮助