我正在使用maluuba API(Malubba Dev Site),这是一种自然语言处理API,但他们在文档中没有提到如何将用户对麦克风说出的声音转换为实际文本。那是CoreAudio能做的吗?如果是这样,我将如何实现?
答案 0 :(得分:1)
Core Audio中没有(当前或公开的)将连续语音识别转换为文本。 (Siri据说通过压缩一些录制的音频输入并将其发送到Apple或之前的Nuance服务器进行识别和处理查询来工作。)
核心音频对于此录音部分非常有用。
尝试在iOS上进行语音识别的开源项目是OpenEars,使用CMU的PocketSphinx技术。报告的结果质量各不相同。您也可以尝试联系Nuance,看看他们是否可能以某种价格许可使用他们的语音识别API。