我有一个wav音频文件,已将其转换为单通道,然后进一步转换为FLAC音频形式。
声音= AudioSegment.from_wav(“ / Users / tcssig / Downloads / sample.wav”)
sound.channels 1
{
"config": {
"encoding":"FLAC",
"languageCode": "fi-FI"
},
"audio": {
"uri":"gs://g_stt/fin11.flac"
}
}
import requests
headers = {
'Content-Type': 'application/json',
}
params = (
('key', '****************************'),
)
data = open('/Users/tcssig/Documents/request.json', 'rb').read()
response = requests.post('https://speech.googleapis.com/v1/speech:longrunningrecognize', headers=headers, params=params, data=data)
使用Google语音到文本api生成成绩单,它会给我错误提示:
{'error': {'code': 400,
'message': 'Invalid audio channel count',
'status': 'INVALID_ARGUMENT'}}
因为API支持单声道而不是立体声声道,所以我不明白为什么对于FLAC格式的单个音频声道文件会发生这种情况。