使用Microsoft Azure(REST API)批量转录

时间:2018-10-22 15:03:05

标签: speech-to-text azure-cognitive-services microsoft-speech-api

我想使用Microsoft的REST API转录更长的音频文件(至少5分钟)。有很多不同的产品和名称,例如语音服务API或Bing语音API。到目前为止,我尝试过的REST API都不支持转录更长的音频文件。

文档指出,正是针对这种情况的REST API: https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription

此服务的终结点是什么?

1 个答案:

答案 0 :(得分:6)

在GitHub上有一个示例:https://github.com/PanosPeriorellis/Speech_Service-BatchTranscriptionAPI

端点是CRIS的端点,如以下代码所示:

private const string HostName = "cris.ai";
// ...
var client = CrisClient.CreateApiV2Client(SubscriptionKey, HostName, Port);

然后我在文档中发现该API在Swagger上公开(链接可见here),因此更容易探索可用的方法(从2.0beta切换到顶部的2.0):

因此,要创建新的转录,路径为:/api/speechtotext/v2.0/transcriptions,用POST方法调用,因此完整端点为:

请注意,使用转录所需的订阅密钥级别必须是Standard级定价S0,而不是Free级。