嗨:)我建立了一个带有webhook的Facebook messenger机器人到我的服务器来处理消息。
最近我添加了一个很酷的功能 - 语音识别。
但是,我收到了Facebook音频附件作为 mp4文件的URL,没有熟悉的Speech 2文本api(Google语音,Watson等等)支持mp4所以我必须将其转换为FLAC,之后我可以获得成绩单。
它花了我大约6-8秒到5秒音频..
有没有支持mp4的Speech 2 text api?或者从Facebook获取FLAC音频的任何方式?
谢谢!