我们正在建立一个基于网络的信息系统,但在我们的一些工作站上(假设为5%),我们需要从网页上获得语音识别。今天我们使用本地WCF客户端从网页开始的本地winform(我们之后也用于将文本放入webeditor),但这不是最好的集成。我不想要那个winform。我希望文本立即出现在网站上。
关于语音识别:我们有API,但这是本地软件。我们必须与他们互动,因为网页中的原生语音识别仍然是很难做到的,特别是当你必须与speechmike(和按钮)等进行交互时。
我们的想法是在backgroundground应用程序中进行识别,并将结果发送到网页中的编辑器。我们可以将本地应用程序作为本地Web服务器运行,例如与网页通信。
所以我的问题是:从网页上与本地应用程序通信的最佳选择是什么(反之亦然)知道我们有一个受控环境,我们既可以控制(开发)网页,也可以控制本地应用。我正在考虑的事情是在本地(主机)应用程序和网页之间使用websocket将文本从应用程序传输到网站。请告诉我你对此的看法。
答案 0 :(得分:1)
HTML5音频api允许您录制音频,您可以在此处找到示例:
http://www.html5rocks.com/en/tutorials/getusermedia/intro/
您可以找到此实现的几个扩展,例如
https://github.com/mattdiamond/Recorderjs
您可以将捕获的音频发送到服务器,以便使用websockets进行处理。如果你正在运行node.js服务器,你可以使用socket.io,你可以在这里找到示例:
https://github.com/cmusphinx/node-pocketsphinx/blob/master/demo/public/index.html
新浏览器支持此框架,如果您想支持旧版浏览器,可以使用闪存技术,例如参见: