是否可以获取用户在VoiceXML应用程序中所说内容的字符串表示? 例如,在数据库查询中使用它。
到目前为止,我见过的大多数例子只是尝试匹配(xml-)定义的选择数量。 如果想要使用输入来匹配数据库,并且假设> 100k条目,则这是不合适的。
由于
答案 0 :(得分:2)
您可以将语音输入作为包含最后结果的发音属性的字符串(VoiceXML specification)
然而,这不是你的问题。您需要一个开放式语法或一个可以处理100K条目的系统。这是识别引擎的工件,而不是VoiceXML语言。理论上,您可以构建一个100K SRGS语法。实际上,如果它们都是独特的输入而没有更清晰的定义方式,那可能实在太大了。您可以使用Nuance等引擎的本机语法,静态列表或条目或由项目组件组成的统计语言模型(假设它们共享公共组件)。
你可以看一下听写引擎。我认为我没有看到任何附加到VoiceXML平台,因为它们通常与普通的VoiceXML用例没有很好地对齐,大多数听写引擎需要训练和常规句子结构来完全识别输入。