将语音输入作为字符串

时间:2010-12-11 02:52:47

标签: speech-recognition speech-to-text voicexml

是否可以获取用户在VoiceXML应用程序中所说内容的字符串表示? 例如,在数据库查询中使用它。

到目前为止,我见过的大多数例子只是尝试匹配(xml-)定义的选择数量。 如果想要使用输入来匹配数据库,并且假设> 100k条目,则这是不合适的。

由于

1 个答案:

答案 0 :(得分:2)

您可以将语音输入作为包含最后结果的发音属性的字符串(VoiceXML specification

然而,这不是你的问题。您需要一个开放式语法或一个可以处理100K条目的系统。这是识别引擎的工件,而不是VoiceXML语言。理论上,您可以构建一个100K SRGS语法。实际上,如果它们都是独特的输入而没有更清晰的定义方式,那可能实在太大了。您可以使用Nuance等引擎的本机语法,静态列表或条目或由项目组件组成的统计语言模型(假设它们共享公共组件)。

你可以看一下听写引擎。我认为我没有看到任何附加到VoiceXML平台,因为它们通常与普通的VoiceXML用例没有很好地对齐,大多数听写引擎需要训练和常规句子结构来完全识别输入。