应用错误收集

时间：2016-08-03 11:45:31

标签： c# speech-to-text microsoft-cognitive

我正在使用 Microsoft语音识别 - REST API 将音频文件转换为文本。我能够从演讲中获得文字，但只能获得部分内容。

如果我使用长度大于50秒的音频文件。它只返回前50秒的文本结果，并忽略50秒后的任何内容。是否有音频长度的限制或我错过了什么？

非常感谢您的帮助。非常感谢。

Bishwa

答案 0 :(得分：0)

文档here说：

您的应用程序必须对音频进行端点化以确定开始和结束语音，然后服务使用该语音来确定请求的开始和结束。您可能无法在任何一个请求中上传超过10秒的音频，并且总请求持续时间不能超过14秒。

这表明你很幸运能得到50秒相反，你应该将音频切换成更小的块并发出多个请求。