.NET预定义文本的语音识别

时间:2014-11-22 20:15:55

标签: c# .net speech-recognition dictation

我正在开发一个应用程序,用户阅读一些预定义的文本,我们使用语音识别引擎,他说的是成绩单。然后我们将结果与预定义文本进行比较,以找出他正在阅读的文本的哪个句子或部分。

我们使用Nuance NDev作为我们的语音识别引擎,但现在花费太多,我们正试图寻找另一种选择。

所以我正在尝试.NET语音识别引擎,但我无法找到实现这一目标的方法。

从我的测试:

  • 听写语法很好,因为它翻译了用户说的每个单词,但结果却非常混乱,所以找到匹配几乎是不可能的。

  • GrammarBuilder和Choises类的混合更像是一个命令=>动作类型的东西,它不会翻译用户说的所有单词,它只搜索一个特定的单词/命令并打印出来。

所以我想知道的是,是否有一种方法可以获得语法,如行为,但只有一部分单词,比如我预定义文本中的所有单词,或者让我设置单词/句子来帮助识别引擎。

例如,如果我向引擎提供此预定义文本:

  

一天早上,当格里高尔萨姆莎从困扰的梦中醒来时,他发现自己在床上变成了一个可怕的害虫。他躺在他的盔甲般的背上,如果他抬起头,他可以看到他的棕色的腹部,略微圆顶,并由拱形分成僵硬的部分。

它只能返回此文字中的单词。因此,识别将更容易,更准确。

如果您对如何实现这个或任何其他替代方案有任何想法,我会全力以赴。唯一的限制是,它必须支持英语法语语言。

感谢。

1 个答案:

答案 0 :(得分:1)

一种选择是通过互操作C#绑定从CMUSphinx尝试pocketsphinx引擎。它允许您指定从文本编译的语言模型,然后它将准确地检测单词。

提供法语和英语模型。