我需要接收音频流,获取转录,然后将转录流传输到另一个服务,它可以是翻译或自然语言API;需要连续处理输入语音流 是否有人对如何将语音API输出作为输入传递到另一个dowsnstream API有想法/建议?
答案 0 :(得分:0)
如果我们看这里
https://cloud.google.com/speech-to-text/docs/streaming-recognize
我们找到了一些有关接收语音流到文本转换的有用信息。似乎发生的情况是,注册了一个回调,并且在处理了“块”翻译文本时,将调用该回调,并将翻译后的音频作为文本表示传入。至此,您现在有了一个单位的文本,这将成为您处理的责任。根据您的描述,似乎您随后将调用传入的文本来传递下游API。