Azure认知服务的语音服务(SST)支持哪些音频格式?

时间:2018-07-31 13:11:02

标签: python speech-to-text microsoft-cognitive azure-cognitive-services pydub

请记住,据我所知,Microsoft / Azure Cognitive Services的“语音服务”目前正在进行合理化练习

https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-apis#speech-to-text

https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home

.wav个二进制文件是可接受的,其他给出响应的文件:

{"Message":"Unsupported audio format"}

还有其他方法来发现可接受的音频格式/编码/等吗?

[奖金点,用于在python .m4a中预处理任意/ pydub音频格式的技巧,使它们符合标准-当前适用于.mp3,但不适用于.m4a]

谢谢!

1 个答案:

答案 0 :(得分:3)

当前支持的格式为single-channel (mono) WAV / PCM with a sampling rate of 16 kHz。将来会添加更多格式和编解码器支持。