speech-recognition - 将语音输入作为字符串

您可以将语音输入作为包含最后结果的发音属性的字符串（VoiceXML specification）

然而，这不是你的问题。您需要一个开放式语法或一个可以处理100K条目的系统。这是识别引擎的工件，而不是VoiceXML语言。理论上，您可以构建一个100K SRGS语法。实际上，如果它们都是独特的输入而没有更清晰的定义方式，那可能实在太大了。您可以使用Nuance等引擎的本机语法，静态列表或条目或由项目组件组成的统计语言模型（假设它们共享公共组件）。

你可以看一下听写引擎。我认为我没有看到任何附加到VoiceXML平台，因为它们通常与普通的VoiceXML用例没有很好地对齐，大多数听写引擎需要训练和常规句子结构来完全识别输入。

将语音输入作为字符串

1 个答案: