作为一个个人项目(为了更好地学习python),我开始研究一个重复的文件移除器(特别是.mp3文件,因为我在尝试组织我的完全重复的音乐集合时想到了它)。现在,我非常清楚如何继续,匹配文件名和提供删除仅提供0.7相似比率的那些,并使用md5总和用于那些相同但具有完全不同名称的文件(例如:“metallica” - 没有其他事情“和”Track1“)。问题是我不知道如何处理那些具有不同名称并且彼此有点不同的文件,例如,“没有其他问题”和“Track1”是相同的,除了“ Track1“最后有2秒的沉默。我的问题是:是否有某种方法或算法可以检查文件本身之间的相似性?像字符串匹配但文件?如果它是一个复杂的算法并不重要,那么越难越好,因为我这样做只是为了学习:D
答案 0 :(得分:4)
您可以使用Chromaprint来计算一段音乐的指纹。它应该能够找到类似的音乐文件。
如果您想进一步推动,可以使用musicbrainz的api查找有关音乐的确切信息。
答案 1 :(得分:0)
你也可以看看win32模块,这里是链接