Google语音+自然语言管道

时间:2018-12-13 12:45:54

标签: google-app-engine google-cloud-platform google-cloud-dataflow google-speech-api

我正在尝试执行以下操作:

我要创建以下管道(将在Google云上运行)

  • 我有一个设备:带麦克风的树莓派
  • 我将音频从树莓派发送到Google(流:实时
  • 它被转录为文本( Google Cloud Speech
  • 分析文本( Google Cloud Natural Language
  • 我要进行一些后期处理
  • (处理结果)返回给Raspberry pi

我知道我可以进行语音识别请求,然后使用API​​的结果,将其直接发送给自然语言,等等

但是我想知道这样的管道是否可行。 我尝试使用 Google DataFlow Google App Engine ,但找不到任何方法与他们建立这种管道。

谢谢

3 个答案:

答案 0 :(得分:1)

如果只有一台设备可以产生语音输入,则只需一个简单的解决方案就可以了(用音频和翻译/视觉api和语音/自然语言api替换图像)

enter image description here

云存储可以触发云功能,而云功能又可以使用云发布/订阅来触发其他云功能。

有关详情,请参见此link

答案 1 :(得分:0)

我认为Google DataFlow不是您要构建的管道的正确选择,主要是因为您没有尝试构建分析管道。我认为它看起来像link here,然后转到“无服务器IoT后端”部分。使用Cloud Function对所有处理进行流水线处理,然后将结果返回给您的设备。还要看示例here。 尽管我的回答相当广泛,但是希望它能为您提供一些尝试的指导。

答案 2 :(得分:0)

云功能是必经之路。这是一个演示应用程序,它利用Cloud Vision API,GMail API,PubSub和CloudFunctions构建了智能的GMail标签服务。

结构图 enter image description here

链接到代码:https://github.com/GoogleCloudPlatform/cloud-functions-gmail-nodejs

链接到博客文章:https://cloud.google.com/blog/products/application-development/adding-custom-intelligence-to-gmail-with-serverless-on-gcp

在您的情况下,架构流程可能类似于以下内容
1.将音频从Raspberry Pi发送到Cloud Storage存储桶
2.使用“云功能”收听“云存储”存储桶(Reference)中的更改
3.触发从Cloud Function到Cloud Speech API的调用以转录音频
4.再使用一个Cloud Function触发对NLP API的调用
5.进行后处理并将其写入输出存储桶
6.使用云功能侦听输出存储桶并触发调用以将输出发送回Raspberry Pi。