我似乎无法找到与我的问题相符的主题。语音识别不是我的强项,所以请原谅我不知道语音识别的来龙去脉。
我有一个很好地使用语法命令文件的模拟器。如果我说一个命令,它就会得到很准确的识别。我的问题是识别器不能快速连续地处理字符串/说出多个命令。由于我的模拟器是空中交通管制SIM卡,我将使用该术语作为例子:
短语A:滑行路径
短语B:课程
示例:我说“在滑行路径上”。如果两个短语之间的时间没有足够大的差距,则忽略第二个短语。当收听最后一个短语时,我只听到“在滑行路径上”,所以看起来识别器从流中获取一大块音频,处理它,然后向下移动下一个音频块。但问题是它为下一个命令剪掉了音频。
我不知道该怎么办。它是一个语音引擎问题,语法文件问题,还是可能无法帮助的东西(因为我正在做连续命令而不是连续听写)?任何指针或帮助将不胜感激。就像我说的那样,如果我在命令之间留下0.5-1秒的间隙,它可以正常工作,但空中交通管制员可能是快速的说话者,所以我试图找出改进。