我有一个大型的旧音乐库(20世纪20年代,30年代,40年代等),有很多副本,我想确定重复项并用相同的MP3标签信息组织它们。由于音乐是在不久前录制的,虽然它们听起来与人耳相似,但它们的录音实际上可能有点不同(更安静,更静电等)。
我正在使用pydub
解析一些音乐,并且能够生成wav文件,删除歌曲开头和结尾的静音,并压缩音乐的动态范围,但是我我希望能够比较wav文件,这样如果它们足够相似,我可以假设它们是相同的并给它们相同的标签。
是否可以通过像scipy
和numpy
这样的方式运行wav文件数据,以便使用傅里叶变换/ FFT之类的方法以高精度比较/关联数据?我知道它可以通过像dejavu
这样的系统来完成,但它非常密集并且在数据库中使用了大量存储空间,而且我可以访问原始文件而不是使用麦克风,所以我更喜欢做一些更简单的事情。