我一直在Azure中使用(预览)CRIS语音来提供文本服务。对于一些简短的wav文件,我得到一个正确的文本等价物,但后面是" non"。这是一个关键词含义"非词"或者这是一个错误? - 当我使用基本会话模型时,以及当我使用基于基本会话模型的自定义语言模型时,它都会发生,但是"搜索和听写&34>会发生不 #34;模型。
例如,我发送一个嘈杂的wav文件,其中有人说"是"我回来了#34;是非"。如果wav文件没有噪声,则不会发生这种情况,并且如果说出的文本是两个或更多单词则不会发生。它似乎发生在嘈杂的单字文件上。什么"非"意思?答案 0 :(得分:0)
与产品组讨论后,这显然是当前CRIS版本中的一个错误,很快就会修复。 “非”并不意味着什么,它只是在背景噪音爆发时出现。