我开始探索Google Cloud Speech API。
我已经读过那个
“Speech API支持任何可以发送REST请求的设备”
因此我认为我可以从任何浏览器(笔记本电脑和移动设备上)调用此类API。具体来说,我对使用API将“语音”翻译为文本的场景感兴趣。我正在搞清楚以下内容:
我搜索了一下,收集了一些信息,但我有一些很大的疑问,我想在实际沿着这条路走的路上清楚
getUserMedia
API)非常感谢这些方面的任何方向。
答案 0 :(得分:0)
从iOS11开始,Apple已添加支持getUserMedia
API。
您可以找到更多here。
<强>更新强> 流式语音识别是流式音频(https://cloud.google.com/speech/docs/streaming-recognize)
的潜在解决方案