我正在做一个从语音转换为文本的应用程序。我用谷歌搜索,发现谷歌语音API是谷歌的选择。现在我遇到一个问题:当用户与ios设备通话时,如何捕获音频文件?是否应该引入任何框架或API?什么是原始音频文件,WAV或MP3的类型?谢谢。
答案 0 :(得分:0)
为什么不查看有关此主题的一些现有StackOverflow问题。试试Speech to text Conversion.?或What is the current best speech recognition API for ios to match few keywords?