python - 是否有可能比较两个相似的歌曲给他们的wav文件？

我有一个大型的旧音乐库（20世纪20年代，30年代，40年代等），有很多副本，我想确定重复项并用相同的MP3标签信息组织它们。由于音乐是在不久前录制的，虽然它们听起来与人耳相似，但它们的录音实际上可能有点不同（更安静，更静电等）。

我正在使用pydub解析一些音乐，并且能够生成wav文件，删除歌曲开头和结尾的静音，并压缩音乐的动态范围，但是我我希望能够比较wav文件，这样如果它们足够相似，我可以假设它们是相同的并给它们相同的标签。

是否可以通过像scipy和numpy这样的方式运行wav文件数据，以便使用傅里叶变换/ FFT之类的方法以高精度比较/关联数据？我知道它可以通过像dejavu这样的系统来完成，但它非常密集并且在数据库中使用了大量存储空间，而且我可以访问原始文件而不是使用麦克风，所以我更喜欢做一些更简单的事情。

是否有可能比较两个相似的歌曲给他们的wav文件？

1 个答案: