过去几天我一直在处理我的应用程序的一部分,我需要同时播放和录制音频文件。我需要完成的任务只是将录音与播放的音频文件进行比较并返回匹配的百分比。这是我到目前为止所做的以及我的问题的一些背景:
目标API>> 15
我决定使用.wav音频文件格式来简化文件解码
以下是我的一些问题:
我是以正确的方式解决这个问题还是我错过了什么?
答案 0 :(得分:1)
在像Shazam这样的应用中,Midomi音频匹配是使用称为音频指纹的技术完成的,该技术使用频谱图和散列。
这是一个有点详细的过程,您可以在此链接中找到更多解释http://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf
有些库可以为你做dejavu(https://github.com/worldveil/dejavu)和chromaprint(用c ++编写)。谷歌的Musicg是在java中,但它在背景噪音方面表现不佳。
匹配两个音频文件是一个复杂的过程,就像上面的评论一样,我也会告诉你先在电脑上试用,然后在手机上试试。