我正在开发一款适用于iPhone的游戏,通过提供YES / NO响应可以完全使用。
通过允许语音控制,让盲人用户,跑步者和驾驶汽车的人都可以使用这款游戏。这不需要完整的语音识别,我希望实现关键字定位。
我已经可以检测到话语的开始和停止,并已在https://github.com/fulldecent/FDSoundActivatedRecorder实现了这一点。下一步是为各种各样的用户可靠地区分YES和NO响应。
问题:为了获得合理的性能(在语音停止后的0.5秒内区分是/否/停止),AVAudioRecorder
是合理的选择吗?是否有满足这些需求的已发布算法?
答案 0 :(得分:3)
这里最好的选择是OpenEars,一个适用于iOS的免费开放语音识别平台。
http://www.politepix.com/openears/
你很可能不想进入这个算法方面。这是巨大而令人讨厌的 - 有一个原因只有少数公司从头开始进行语音识别。