网页与本地语音识别应用之间的通信

时间:2015-02-19 20:10:45

标签: websocket local speech

我们正在建立一个基于网络的信息系统,但在我们的一些工作站上(假设为5%),我们需要从网页上获得语音识别。今天我们使用本地WCF客户端从网页开始的本地winform(我们之后也用于将文本放入webeditor),但这不是最好的集成。我不想要那个winform。我希望文本立即出现在网站上。

关于语音识别:我们有API,但这是本地软件。我们必须与他们互动,因为网页中的原生语音识别仍然是很难做到的,特别是当你必须与speechmike(和按钮)等进行交互时。

我们的想法是在backgroundground应用程序中进行识别,并将结果发送到网页中的编辑器。我们可以将本地应用程序作为本地Web服务器运行,例如与网页通信。

所以我的问题是:从网页上与本地应用程序通信的最佳选择是什么(反之亦然)知道我们有一个受控环境,我们既可以控制(开发)网页,也可以控制本地应用。我正在考虑的事情是在本地(主机)应用程序和网页之间使用websocket将文本从应用程序传输到网站。请告诉我你对此的看法。

1 个答案:

答案 0 :(得分:1)

HTML5音频api允许您录制音频,您可以在此处找到示例:

http://www.html5rocks.com/en/tutorials/getusermedia/intro/

您可以找到此实现的几个扩展,例如

https://github.com/mattdiamond/Recorderjs

您可以将捕获的音频发送到服务器,以便使用websockets进行处理。如果你正在运行node.js服务器,你可以使用socket.io,你可以在这里找到示例:

https://github.com/cmusphinx/node-pocketsphinx/blob/master/demo/public/index.html

新浏览器支持此框架,如果您想支持旧版浏览器,可以使用闪存技术,例如参见:

https://code.google.com/p/red5/