c# - Microsoft.CognitiveServices.Speech 中的自动语言检测

Microsoft.CognitiveServices.Speech 中的自动语言检测

时间：2021-02-11 09:35:34

标签： c# speech-to-text microsoft-cognitive

我们正在试验 Microsoft.CognitiveServices.Speech 中的自动语言检测功能。我们的测试用例是转录挪威新闻直播，其中一些 VB 可能是其他语言，例如来自美国正在进行的弹劾审判。从整个试验开始，我们在现场直播时取得了很好的效果，但是在挪威新闻广播中间使用较短的英语 VB，识别器无法检测到语言已经改变，结果相当难以理解（自然）。< /p>

我的问题是，在这种情况下，SpeechRecognizer 检测源语言的变化需要什么？我们可以做些什么来改善这种行为？如果我们能够可靠地进行这项工作，就会显着改善我们的结果。

预先感谢您提供任何提示/技巧。

2 个答案:

答案 0 :(得分：2)

SpeechRecognizer 还不能识别音频中的语言切换，这将在不久的将来添加。

答案 1 :(得分：1)

对较短音频话语的要求之一是它们需要至少有 5 秒的人类语音，语言检测才能在估计口语方面做出合理的工作。