我有一个在xampp apache中运行的简单JS代码。
var rawFile;
var allText;
var byteArray = [];
rawFile = new XMLHttpRequest();
rawFile.open("GET", "brooklyn.flac", false);
rawFile.onreadystatechange = function ()
{
if(rawFile.readyState === 4)
{
if(rawFile.status === 200 || rawFile.status == 0)
{
allText = rawFile.responseText;
//alert(allText);
}
}
if (rawFile.status != 200) return byteArray;
for (var i = 0; i < rawFile.responseText.length; ++i) {
byteArray.push(rawFile.responseText.charCodeAt(i) & 0xff)
}
}
rawFile.send(null);
function send(){
var oAjaxReq = new XMLHttpRequest();
var payload = {
config:{
encoding: "FLAC",
sampleRateHertz: 16000,
languageCode:"en-US"
},
audio: {
content: rawFile
}
};
oAjaxReq.open("post", "https://speech.googleapis.com/v1/speech:recognize?key=???", true);
oAjaxReq.setRequestHeader("Content-Type", "application/json");
//object ot json
const jsonPayload = JSON.stringify(payload);
//Length of the jsonPayload
const payLoadLength= jsonPayload.length;
oAjaxReq.setRequestHeader("Content-Length", payLoadLength);
oAjaxReq.withCredentials = true;
//Send Json to Google Cloud Speech Service
oAjaxReq.send(jsonPayload);
}
我正在尝试使用Google Cloud Speech API。 我正在加载一个名为“brooklyn.flac”的本地音频文件,我从“https://storage.googleapis.com/cloud-samples-tests/speech/brooklyn.flac”通过xmlHTTPRequest下载。
但是,我总是收到以下错误:
{
"error": {
"code": 500,
"message": "Internal error encountered.",
"status": "INTERNAL"
}
}
当我将payLoad对象的音频部分从“content:rawFile”更改为“uri:”gs://cloud-samples-tests/speech/brooklyn.flac时“它正常工作。
错误是因为“rawFile”吗? 如果是,我如何正确加载此本地文件以将其发送到云服务?
答案 0 :(得分:1)
TL; DR - 除了您的音频内容外,其他有效负载对我来说都很好。您很可能不使用base64
对音频进行编码(因为您没有提及任何相关内容),因此会出现服务器错误。传递音频内容的base64
编码版本将解决问题。
使用Cloud Speech API有两种主要方式:
它们都支持以下任一音频内容:
使用Google云端存储是IMO中最简单的两种方法。您将文件上传到GCS并传递文件的URI(例如gs://cloud-samples-tests/speech/brooklyn.flac
)。
如果您要将原始文件作为请求的一部分发送,则根据您使用的API,您需要相应地处理内容:
基于JSON的REST API requires that the audio content be base64
encoded。该链接还提供了有关如何在Python,Node.js和Java中执行base64编码的示例。
基于gRPC的API支持二进制文件上传,因此您可以按原样传递原始文件,无需任何其他处理。
我不确定Node.js
是否可以选择,但如果是这样的话 - 您可以use the Google Cloud client library(仅在撰写本文时支持Alpha中的语音识别)。该库可以自动base64
为您编码文件,并提供其他方便的功能。