语音到文本的大型音频文件[Microsoft Speech API]

时间:2018-06-11 11:12:28

标签: speech-recognition speech-to-text microsoft-cognitive bing-api microsoft-speech-api

使用Microsoft Speech API转录中/大型音频文件的最佳方法是什么,每个文件约6-10分钟?像批量音频文件转录的东西?

我使用了https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample中提供的代码,用于连续录制语音,但它在某些时候停止转录。对转录有任何限制吗?我只使用免费试用帐户atm。

顺便说一句,我认为Bing Speech API和新的Speech服务API之间没有区别,对吗?

谢谢大家!

2 个答案:

答案 0 :(得分:2)

感谢您的反馈。

我同意示例(以及您正在查看的文档)不是很清楚,我们将尽快对其进行更新。

该示例使用RecognizeAsync,并且应将其称为RecognizeOnceAsync。当前,它只是试图从服务中返回FIRST FinalResult。您应该使用Start / StopRecognizeAsync,并进行注册以接收Result事件。

同样,对于此处的错误文档,我们深表歉意,我们将尽快对其进行更新,并且可能会在刷新后重新命名该API。

如果您有音频文件,则还可以使用批处理转录功能。也许有帮助吗? https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/batch-transcription

欢呼沃尔夫冈

答案 1 :(得分:1)

语音服务允许每月5,000次交易,免费试用期间每分钟20次,因此可能会因为实时连续识别而超过每分钟20次限制。