我正在研究谷歌云语音api我用我的flac文件尝试了他们的api但是他们只是转录我的flac格式文件的一部分。我有什么我可以用我的文件使它完美地工作。我尝试过在link上测试他们的api。我在请求正文中传递这个
{ “audio”:{ “uri”:“gs://kami1994/file-1506682082651.flac” }, “config”:{ “编码”:“FLAC”, “languageCode”:“en-US”, “sampleRateHertz”:44100, “maxAlternatives”:1 } }
但它并没有像我说的那样回复文字。
答案 0 :(得分:0)
语音识别引擎预计会非常准确但不是100%。要进一步调试您的问题,您可以在识别配置中启用字时间偏移。
"config": { "encoding": "FLAC", "languageCode": "en-US", "sampleRateHertz": 44100, "maxAlternatives": 1, **"enable_word_time_offsets": True** }
这有助于您检查是否检测到单词边界。