考虑多个(至少两个)不同的音频文件,例如几种不同的混音或混音。天真的我会说,必须有可能检测到两个或多个文件中几乎相等的样本,特别是人声,当然只有这样,如果声音样本没有被修改,拉伸,音调,反响太多等
那么通过什么样的算法或技术可以做到这一点?假设用户会尝试在所有文件中尽可能设置时间标记,这些时间标记描述要比较的数据窗口,包含可能相等的声音,人声等。
我知道没有直接的方法,试图以任何方式直接比较wav数据是有用的。但即使我有频域数据(例如来自FFT),我也不得不使用一种比较算法,通过时间尺度来改变比较窗口,因为我不能假设样本,我想找到,是时间同步所有文件。
提前感谢任何建议。
答案 0 :(得分:0)
嗨,这是可能的!!
您可以使用一种称为LSH(局部敏感哈希)的技术,非常强大。
另一种方法是尝试在音频文件中进行频谱图分析......
构建数据库歌曲
1. Record your Full Song
2. Transform the sound to spectrum
3. slice your Spectrogram in chunk and get three or four high Frequencies
4. Store all the points
匹配歌曲
1. Record one short sample.
2. Transform the sound into another spectrum
3. slice your Spectrogram in chunk and get three or four hight Frequencies
4. Compare the collected frequencies with your database song.
5. your match is the song with have the high hit !
你可以在这里看到如何制作..
ederwander