Microsoft.CognitiveServices.Speech 中的自动语言检测

时间:2021-02-11 09:35:34

标签: c# speech-to-text microsoft-cognitive

我们正在试验 Microsoft.CognitiveServices.Speech 中的自动语言检测功能。我们的测试用例是转录挪威新闻直播,其中一些 VB 可能是其他语言,例如来自美国正在进行的弹劾审判。从整个试验开始,我们在现场直播时取得了很好的效果,但是在挪威新闻广播中间使用较短的英语 VB,识别器无法检测到语言已经改变,结果相当难以理解(自然)。< /p>

我的问题是,在这种情况下,SpeechRecognizer 检测源语言的变化需要什么?我们可以做些什么来改善这种行为?如果我们能够可靠地进行这项工作,就会显着改善我们的结果。

预先感谢您提供任何提示/技巧。

2 个答案:

答案 0 :(得分:2)

SpeechRecognizer 还不能识别音频中的语言切换,这将在不久的将来添加。

答案 1 :(得分:1)

对较短音频话语的要求之一是它们需要至少有 5 秒的人类语音,语言检测才能在估计口语方面做出合理的工作。