Microsoft Speech REST API是否具有音频长度限制

时间:2016-08-03 11:45:31

标签: c# speech-to-text microsoft-cognitive

我正在使用 Microsoft语音识别 - REST API 将音频文件转换为文本。我能够从演讲中获得文字,但只能获得部分内容。

如果我使用长度大于50秒的音频文件。它只返回前50秒的文本结果,并忽略50秒后的任何内容。是否有音频长度的限制或我错过了什么?

代码示例:https://oxfordportal.blob.core.windows.net/speech/doc/recognition/Program.cs

非常感谢您的帮助。 非常感谢。

Bishwa

1 个答案:

答案 0 :(得分:0)

文档here说:

  

您的应用程序必须对音频进行端点化以确定开始和结束语音,然后服务使用该语音来确定请求的开始和结束。您可能无法在任何一个请求中上传超过10秒的音频,并且总请求持续时间不能超过14秒。

这表明你很幸运能得到50秒 相反,你应该将音频切换成更小的块并发出多个请求。