我正在尝试在Google speech input中自动录制语音(仅适用于Chrome)。
实际上,用户必须单击麦克风才能开始录制,但我正在进行用户不与计算机交互的安装。因此,我必须以其他方式触发录音。
似乎您无法通过代码访问语音输入功能,即您无法调用函数来开始录制。所以现在我正在考虑在麦克风上模拟鼠标点击 我尝试过使用javaScript,但似乎只有事件和事件处理程序受到影响(例如,输入字段上的模拟点击会触发其点击处理程序,但不会将焦点放在该字段上。)
所以现在我正在考虑模拟Windows系统鼠标点击,我发现一些可以做到这一点的程序(主要是间隔时间)并且它可以工作,录制开始。 但问题是我必须从浏览器应用程序激活点击模拟 到目前为止最好的赌注是AutoHotkey,它可以让你创建自定义脚本,在我的例子中是一个模拟给定位置鼠标点击的脚本。所以,如果我可以从浏览器执行这个脚本,我会很安全,但我不知道怎么做。
欢迎任何想法和/或想法!
答案 0 :(得分:0)
我遇到了类似的问题。我们想要开始和停止录制,以测试google api在德语中使用语音识别的效果。但还没有找到解决方案。
html5功能仍然有限,仅适用于五个输入字段。也许你在这里找到一些信息: http://lists.w3.org/Archives/Public/public-xg-htmlspeech/2011Feb/att-0020/api-draft.html 我们明天回到这个话题。
答案 1 :(得分:0)
我遇到了类似的问题,然后我看了Mike Pultz的这个网站 -
http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/
基本上,他所做的是他自己创建音频文件,使用Sox将其转换为.flac格式,然后将其发送到Google Voice Api。因此,您无需单击麦克风,或者您可以创建自己的麦克风回叫。
我还在 - https://github.com/seigneur/Voice-Biometrics创建了一个C#解决方案 您可以查看此视频以获取进一步的帮助 - http://www.youtube.com/watch?v=PA00SPOTL-M
希望有所帮助