我正在制作一个应用程序,当识别出拍手的声音时执行动作。我已经研究过简单地测量AVAudioRecorder的平均功率和峰值功率,这可以正常工作,但是如果有其他声音,那么它会报告很多误报。我相信我需要某种音频指纹识别,以便在播放其他音频时工作。现在我知道在SO之前已经问了很多这个问题,但大多数答案都说“使用FFT”,然后那个人说“哦,好吧!”但没有给出明确的解释,我仍然不知道如何使用FFT正确识别声音。
任何人都可以清楚地解释,引用另一个教程,或发布一个链接到一个可以使用音频指纹识别声音的库吗?
谢谢!