我有一个项目,我想在网站中实现语音识别。 想象一下,用户正在进行视频电话呼叫,也没有任何一手可以互动。 只要它能识别某些关键词(如“快照”或“菜单”)就足够了。
我让它在chrome(x-webkit-speech)中工作,但它必须在IE8中。
其他条件:
我不希望任何人给我一个完整的解决方案,但由于我真的很陌生并且匆忙,如果有人能指出我正确的方向,我将不胜感激:)
谢谢!
答案 0 :(得分:0)
我偶然发现了自己的问题...... 这是我的解决方案:
我们用闪光灯录制了声音。 将其转换为.wav。 连接到c#-server的套接字并将该文件作为bytearray发送。 问题: 由于您只接收字节,因此客户端必须首先发送大小并使用某种字符终止它,以便您知道它何时结束。 你不能只是随机取一个字符并用它来终止wav文件。如果没有大小的拳头,你永远不会知道传输何时完成。c#-server运行.NET 4.?它有语音识别功能。 分析.wav文件并将字符串发送回客户端。 flash可以在javascript =>中调用方法问题解决了!
当然这很丑陋,但我们的客户仍对此非常满意,因为它能够满足他所要求的所有条件。