我正在使用Google Cloud Speech API(Rest)进行语音到文本的转换。转换2个单词大约需要2.8秒。有什么方法可以改善这一情况并将其降低到1秒以下?
答案 0 :(得分:0)
基于Speech API的最佳做法,您可以使用 StreamingRecognize 和 single_utterance 属性来优化对短话语的识别,并最大程度地减少通话延迟。
此外,您可以检查Frame size以确认您使用的帧不是很大,因为这会增加延迟。
建议在100毫秒的帧大小之间进行权衡 延迟和效率。