我目前正在尝试使用Google Speech API在Web应用程序中对文本转录进行实时演讲。为此,我必须使用RPC流识别(Web套接字)。我知道有多个client libraries,但没有一个可以将音频直接从网络应用流式传输到Google Speech API。没有简单的JavaScript库。
我也知道可能通过在前端和后端之间建立Web套接字连接来实现这一点,然后,在我的情况下,使用NodeJS客户端库流式传输到Google Speech API。但是,这似乎是不必要的复杂。
是否真的不支持直接从网络应用程序使用流识别?
有谁知道如何做到这一点?
修改 我还没有实际向服务发送流,这是我的问题的基线。 让我重新解释一下我的问题:有没有办法直接从浏览器/麦克风发送音频流到Google Speech API?我的应用程序是用JavaScript(Angular)创建的。
之前我使用过IBM Watson S2T,他们提供JavaScript SDK available through bower that can transcript audio from microphone directly to the service而没有通过后端层。
问候,
Kjetil