我正在创建一个应用程序,它将为键盘上的每个字母预先记录用户的语音,当应用程序运行时,如果用户调用'5',系统键入5应用程序能够接受的当时的输入。我是.NET的人并冒险进入XCode。
我做了一些研究,我很确定使用AV Foundation录制音频。问题是如何在OSX中使用语音识别并使用它来识别键盘上的特定键...即使它可能是我应该采取的方法的一般建议来处理这个项目,也会高度赞赏任何反馈!
感谢先进:)!
答案 0 :(得分:0)
首先让我说清楚。我之前从未这样做过,但我对它是如何完成有一个大概的了解。您需要将音频文件绑定到某个数字/密钥。每当用户对着麦克风讲话时,您都会录制他们的语音并将其上传到服务器,服务器会将用户的音频文件与用户制作的预先录制的音频文件进行比较。
这是一个关于音频指纹识别的SO问题。
How can I Compare 2 Audio Files Programmatically?
您可以比较PHP / Python中的音频文件,并让它返回一个值。例如。如果音频文件a.mp3(在服务器上)与用户刚刚录制的newRecorded.mp3匹配,则返回a.mp3,然后剥离.mp3并保留密钥。
就录制句子和命令而言,您也可以这样做。我将继续对此进行更多的研究,并尽可能地帮助你。
希望这能让您有更好的想法和更简单的做事方式。
和
这可能非常有用,并且会使用内置的语音识别功能。
答案 1 :(得分:-2)
Mac OS X已经内置了语音识别和综合库!使用那些。