单声道音频文件的无效声道数

时间：2019-03-28 11:55:53

标签： speech-to-text google-speech-api

我有一个wav音频文件，已将其转换为单通道，然后进一步转换为FLAC音频形式。

声音= AudioSegment.from_wav（“ / Users / tcssig / Downloads / sample.wav”）

sound.channels 1

request.json

{
  "config": {
      "encoding":"FLAC",
      "languageCode": "fi-FI"
  },
  "audio": {
     "uri":"gs://g_stt/fin11.flac"
  }
}

API请求

import requests

headers = {
    'Content-Type': 'application/json',
}

params = (
    ('key', '****************************'),
)

data = open('/Users/tcssig/Documents/request.json', 'rb').read()
response = requests.post('https://speech.googleapis.com/v1/speech:longrunningrecognize', headers=headers, params=params, data=data)

使用Google语音到文本api生成成绩单，它会给我错误提示：

{'error': {'code': 400,
  'message': 'Invalid audio channel count',
  'status': 'INVALID_ARGUMENT'}}

因为API支持单声道而不是立体声声道，所以我不明白为什么对于FLAC格式的单个音频声道文件会发生这种情况。

0 个答案:

没有答案