标签: google-speech-api
我正在尝试使用https://cloud.google.com/speech-to-text/docs/multiple-voices在音频录制中分离不同的扬声器。但是,该代码段不适用于> 1分钟的音频文件。是否支持此功能,或者音频文件必须拆分?
该API是否还支持除wav以外的任何其他(/压缩)格式?