Question

我尝试通过示例页面（https://cloud.google.com/speech-to-text/）使用谷歌云语音文本API。上传音频文件（.m4a）后效果很好

然后我尝试使用rest API和相同的音频文件来调用这些服务，这是行不通的。

我得到200分，但回复为空。

我用此信息调用rest API

POST https://speech.googleapis.com/v1p1beta1/speech:recognize?key=SOME_KEY

正文：

{
  "audio": {
    "content": "base64 audio content"
  },
  "config": {
    "sampleRateHertz": 16000,
    "encoding": "LINEAR16",
    "languageCode": "en-US"
  }
}

但是在https://cloud.google.com/speech-to-text/上，身体有点像这样

{
  "audio": {
    "content": "/* Your audio */"
  },
  "config": {
    "enableAutomaticPunctuation": true,
    "encoding": "LINEAR16",
    "languageCode": "en-US",
    "model": "default"
  }
}

我不知道为什么在调用rest API时它不起作用。

请帮助

已更新=>

我通过此代码读取了音频文件（例如Google doc中的示例）

const file = fs.readFileSync('FILE_LOCATION')
const audioBytes = file.toString('base64')

Answer 1

在阅读文档时，我找不到对Google Text To Speech支持的“ .m4a”（Apple无损）文件的引用。实际上，恰恰相反。

我建议至少尝试将文件转换为WAV格式的文件并提供该文件。如果可以，请查看您是否无法获得这种格式的原始音频。

请参阅：

谷歌云语音文本休息API返回空响应

1 个答案: