Question

请记住，据我所知，Microsoft / Azure Cognitive Services的“语音服务”目前正在进行合理化练习

仅.wav个二进制文件是可接受的，其他给出响应的文件：

{"Message":"Unsupported audio format"}

还有其他方法来发现可接受的音频格式/编码/等吗？

[奖金点，用于在python .m4a中预处理任意/ pydub音频格式的技巧，使它们符合标准-当前适用于.mp3，但不适用于.m4a]

谢谢！

Answer 1

当前支持的格式为single-channel (mono) WAV / PCM with a sampling rate of 16 kHz。将来会添加更多格式和编解码器支持。