访问Google Cloud语音到文本回复

时间:2019-04-07 15:23:39

标签: google-cloud-platform speech-recognition

我是一个完全的初学者,我希望有人能为我指明正确的方向:我使用了Google Cloud语音转文本API,尤其是longrunningrecognize方法。现在一切正常,我得到了预期的结果:

{
  "name": "4983661747957213554",
  "metadata": {
    "@type": 
"type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata",
    "progressPercent": 100,
    "startTime": "2019-04-07T10:22:26.018723Z",
    "lastUpdateTime": "2019-04-07T10:23:17.659732Z"
  },
  "done": true
}

不过,这已经停留了整整一天。转录已完成,但是我如何访问它?我可以调用哪个变量来查看结果?如何将其保存到文件? 最重要的是,我想知道在GCP中运行Python脚本的最佳方法是什么。

我看到了以下答案:Google cloud speech API response : Parsing iOS 但这使我面临一个非常基本的问题:执行代码的最佳方法是什么?在哪里?

我也尝试过创建* .py文件并对其进行chmod修改,但是有没有更简单的方法来运行简单的脚本?

我的预期结果是最终的文本文件,甚至只是访问操作背后的字符串:我得到了返回。

1 个答案:

答案 0 :(得分:0)

Google在documentation中提供了示例:

在shell中,您可以运行

curl -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
     -H "Content-Type: application/json; charset=utf-8" \
     "https://speech.googleapis.com/v1/operations/4983661747957213554"

上面返回的操作名称是4986661747957213554。它将打印出结果:

{
  "name": "7612202767953098924",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata",
    "progressPercent": 100,
    "startTime": "2017-07-20T16:36:55.033650Z",
    "lastUpdateTime": "2017-07-20T16:37:17.158630Z"
  },
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeResponse",
    "results": [
      {
        "alternatives": [
          {
            "transcript": "okay so what am I doing here...(etc)...",
            "confidence": 0.96096134,
          }
        ]
      },
      {

在Python中,您可以运行demo script