我想为iPad 2构建一个简单的阅读器应用程序,允许用户通过语音控件进行导航/阅读。该应用程序将允许用户进入麦克风现场的模式,并听取预定义的关键字,如“向下”,“向上”,“下一步”,“返回”,“回家”等。 我不想重新发明轮子,所以我只是想知道,如果有人已经这样做了,如果没有,是否有任何好的教程或SDK可用于帮助记录某人的声音,然后比较未来的输出到看看它是否匹配,或者只是处理麦克风?
答案 0 :(得分:0)
让我们暂时搁置一下,这是一个措辞相当模糊的问题。
如果您希望在您的应用中允许语音控制以某种方式在整个设备中运行,则这是不可能的。你的应用程序只能控制自己 - 或者至少它本身以及你通常可以接触设备其他部分的任何外部钩子,比如说,从用户的iTunes库中播放一首歌。
如果您计划在越狱环境中执行此操作,那么您应该找到一些进行语音识别的开源库 - 如果有的话 - 并从那里开始。但是要做好很长时间的准备。
答案 1 :(得分:0)
Dragon Mobile SDK正是您所需要的。 http://dragonmobile.nuancemobiledeveloper.com/
可能还有其他语音识别SDK,但这是我能想到的唯一一个。
答案 2 :(得分:0)
您可以找到名为CMU Sphinx的库。有一个iphone版本叫它 PocketSphinx。看看它是否符合您的需求。
答案 3 :(得分:0)