是否可以直接从浏览器(包括Safari)调用Google Cloud Speech API?

时间:2017-05-15 20:16:24

标签: javascript safari google-cloud-platform mobile-safari google-speech-api

我开始探索Google Cloud Speech API。

我已经读过那个

  

“Speech API支持任何可以发送REST请求的设备”

因此我认为我可以从任何浏览器(笔记本电脑和移动设备上)调用此类API。具体来说,我对使用API​​将“语音”翻译为文本的场景感兴趣。我正在搞清楚以下内容:

  1. 用户录制他/她的声音并将其流式传输到API
  2. API将其转换为发送回浏览器的文本
  3. 浏览器使用收到的文本进行操作(例如保存 后端数据库上的文字)
  4. 我搜索了一下,收集了一些信息,但我有一些很大的疑问,我想在实际沿着这条路走的路上清楚

    1. 直接从中调用Google Cloud API是否可行且简单 浏览器,即使用Javascript?怀疑来自事实 文档显示nodejs examples但不是纯粹的 javascript的
    2. 可以使用Safari(桌面和桌面)实现此场景 在移动)?怀疑来自这样一个事实,即到目前为止我所做的所有搜索都指向我读到Safari不支持录音的页面(即 HTML5的getUserMedia API)
    3. 非常感谢这些方面的任何方向。

1 个答案:

答案 0 :(得分:0)

从iOS11开始,Apple已添加支持getUserMedia API。

您可以找到更多here

<强>更新 流式语音识别是流式音频(https://cloud.google.com/speech/docs/streaming-recognize

的潜在解决方案