标签: google-speech-api google-cloud-speech
Google语音转文本documentation建议使用100毫秒的帧大小以最大程度地减少延迟。
任何帧大小都是可以接受的。较大的帧效率更高,但会增加延迟。建议将帧大小设为100毫秒,以在延迟和效率之间取得良好的平衡。 -最佳做法
但是,我不知道帧大小是多少。 帧大小与AudioBuffer.length相同吗?
AudioBuffer.length
答案 0 :(得分:0)
帧是StreamingRecognizeRequest消息的块,可以包含以下两个字段之一:streaming_config和audio_content。第一个StreamingRecognizeRequest消息将仅发送streaming_config,之后所有后续消息将发送audio_content。
StreamingRecognizeRequest
streaming_config
audio_content
您可以在this和this文档中找到更多详细信息。