当得知Google最终为开发者发布官方语音API时,我感到非常兴奋。我一直对Google的语音识别在Android,Chrome和其他产品中的表现感到惊讶。
我创建了一个Google Cloud帐户,启用了语音API,并在Google Speech API documentation之后创建了一些测试脚本。精度非常高,但速度非常慢。一个18秒的音频文件将使他们的引擎大约16秒转录! Microsoft Bing Speech API只需3-4秒即可完成!
有没有人经历过同样的事?或者这是我配置的问题?任何帮助都非常感谢!
以下是我使用的代码:
BASH:
time curl "https://speech.googleapis.com/v1beta1/speech:syncrecognize?key={MY_API_KEY}" --header "Content-Type: application/json" --data '{"config":{"encoding":"FLAC","sample_rate":16000,"language_code":"en-US"},"audio":{"uri":"gs://accobot-speech/new_record.flac"}}'