Google Cloud Speech Error 500(内部服务器错误)

时间:2017-07-11 20:05:37

标签: javascript xmlhttprequest google-cloud-speech

我有一个在xampp apache中运行的简单JS代码。

var rawFile;
var allText;
var byteArray = [];

rawFile = new XMLHttpRequest();
rawFile.open("GET", "brooklyn.flac", false);
rawFile.onreadystatechange = function ()
{
    if(rawFile.readyState === 4)
    {
        if(rawFile.status === 200 || rawFile.status == 0)
        {
          allText = rawFile.responseText;
            //alert(allText);

        }
    }
     if (rawFile.status != 200) return byteArray;
        for (var i = 0; i < rawFile.responseText.length; ++i) {
        byteArray.push(rawFile.responseText.charCodeAt(i) & 0xff)
        }
     }

rawFile.send(null);

function send(){
var oAjaxReq = new XMLHttpRequest();

var payload = {
  config:{
    encoding: "FLAC",
    sampleRateHertz: 16000,
    languageCode:"en-US"
  },
  audio: {
    content: rawFile
  }
};

oAjaxReq.open("post", "https://speech.googleapis.com/v1/speech:recognize?key=???", true);
oAjaxReq.setRequestHeader("Content-Type", "application/json");

//object ot json
const jsonPayload = JSON.stringify(payload);

//Length of the jsonPayload
const payLoadLength= jsonPayload.length;
oAjaxReq.setRequestHeader("Content-Length", payLoadLength);
oAjaxReq.withCredentials = true;

 //Send Json to Google Cloud Speech Service
 oAjaxReq.send(jsonPayload);
 }

我正在尝试使用Google Cloud Speech API。 我正在加载一个名为“brooklyn.flac”的本地音频文件,我从“https://storage.googleapis.com/cloud-samples-tests/speech/brooklyn.flac”通过xmlHTTPRequest下载。

但是,我总是收到以下错误:

{
  "error": {
    "code": 500,
    "message": "Internal error encountered.",
    "status": "INTERNAL"
  }
}

当我将payLoad对象的音频部分从“content:rawFile”更改为“uri:”gs://cloud-samples-tests/speech/brooklyn.flac时“它正常工作。

错误是因为“rawFile”吗? 如果是,我如何正确加载此本地文件以将其发送到云服务?

1 个答案:

答案 0 :(得分:1)

TL; DR - 除了您的音频内容外,其他有效负载对我来说都很好。您很可能不使用base64对音频进行编码(因为您没有提及任何相关内容),因此会出现服务器错误。传递音频内容的base64编码版本将解决问题。

音频内容的API类型和来源

使用Cloud Speech API有两种主要方式:

它们都支持以下任一音频内容:

  • Google云端存储
  • 您在请求中直接发送的原始文件。

使用Google云端存储是IMO中最简单的两种方法。您将文件上传到GCS并传递文件的URI(例如gs://cloud-samples-tests/speech/brooklyn.flac)。

编码音频内容

如果您要将原始文件作为请求的一部分发送,则根据您使用的API,您需要相应地处理内容:

  • 基于JSON的REST API requires that the audio content be base64 encoded。该链接还提供了有关如何在Python,Node.js和Java中执行base64编码的示例。

  • 基于gRPC的API支持二进制文件上传,因此您可以按原样传递原始文件,无需任何其他处理。

Google Cloud客户端库

我不确定Node.js是否可以选择,但如果是这样的话 - 您可以use the Google Cloud client library(仅在撰写本文时支持Alpha中的语音识别)。该库可以自动base64为您编码文件,并提供其他方便的功能。