在寻找使用flash语音识别的方法时,我使用VoiceXML交叉路径。我已经完成了对它的W3C描述,但我仍然有一些很大的疑问。
我可以简单地创建一个vxml doc并将其放在我的网络服务器上吗?有什么要求?
它会起作用吗?
我可以通过互联网输入麦克风吗?
我似乎无法找到答案。
答案 0 :(得分:1)
您需要相当于知道如何处理VoiceXML的浏览器。
我在电信行业工作,因此通常意味着通过旧式电话连接或通过VoIP连接到公共电话网络的软件。该领域有许多商业和一些开源解决方案。
还有其他一些实现,例如Opera和可访问性领域的一些研究计划,但我没有看到它们聚集在一起。
我不会将VoiceXML看作是接近语音识别的最简单方法。也就是说,没有简单的方法,也没有很多免费/开源解决方案。 Microsoft平台上最简单的方法是查看Microsoft的SAPI层以及它们提供的免费,最小的ASR。在Linux端,请查看CMU Sphinx。
答案 1 :(得分:1)
VoiceXML是一种标记旨在通过语音(通常是电话)传送的内容的方式。就像HTML是如何格式化您希望通过Web浏览器显示的内容一样,VoiceXML就是您将其传送到手机的方式。
VoiceXML本身不会进行语音识别。但是,许多VoiceXML提供商还将语音识别(也称为ASR)引擎与其VoiceXML平台捆绑在一起。
如果您正在寻找一种方法来识别来自计算机上麦克风的语音输入到某种桌面应用程序,那么VoiceXML可能不是您想要的。
Wikipedia在http://en.wikipedia.org/wiki/List_of_speech_recognition_software
列出了一些语音识别软件如果您想了解有关VoiceXML的更多信息,请参阅http://vxml.org/
上的一些优秀文档