我尝试通过示例页面(https://cloud.google.com/speech-to-text/)使用谷歌云语音文本API。上传音频文件(.m4a)后效果很好
然后我尝试使用rest API和相同的音频文件来调用这些服务,这是行不通的。
我得到200分,但回复为空。
我用此信息调用rest API
POST https://speech.googleapis.com/v1p1beta1/speech:recognize?key=SOME_KEY
正文:
{
"audio": {
"content": "base64 audio content"
},
"config": {
"sampleRateHertz": 16000,
"encoding": "LINEAR16",
"languageCode": "en-US"
}
}
但是在https://cloud.google.com/speech-to-text/上,身体有点像这样
{
"audio": {
"content": "/* Your audio */"
},
"config": {
"enableAutomaticPunctuation": true,
"encoding": "LINEAR16",
"languageCode": "en-US",
"model": "default"
}
}
我不知道为什么在调用rest API时它不起作用。
请帮助
已更新=>
我通过此代码读取了音频文件(例如Google doc中的示例)
const file = fs.readFileSync('FILE_LOCATION')
const audioBytes = file.toString('base64')
答案 0 :(得分:1)
在阅读文档时,我找不到对Google Text To Speech支持的“ .m4a”(Apple无损)文件的引用。实际上,恰恰相反。
我建议至少尝试将文件转换为WAV格式的文件并提供该文件。如果可以,请查看您是否无法获得这种格式的原始音频。
请参阅: