用于查找最匹配的二进制文件的实用程序或库

时间:2010-01-14 21:15:40

标签: python diff utility

我希望能够将二进制文件X与其他二进制文件的目录进行比较,并找出哪个其他文件与X最相似。数据的性质是文件之间存在相同的块,但可能转移到位。这些文件的大小都是1MB,其中大约有200个。我希望能够在现代台式计算机上用几分钟或更短的时间快速分析这些内容。 我已经google了一下,发现了一些不同的二进制差异实用程序,但它们似乎都不适合我的应用程序。

例如,有bsdiff,它看起来像是创建了一个针对大小进行了优化的补丁文件。或者vbindiff只是以图形方式显示差异,但这些似乎并没有帮助我弄清楚一个文件是否比另一个文件更像X.

如果没有可以直接用于此目的的工具,是否有人可以推荐用于编写我自己的实用程序的好库? Python会更好,但我很灵活。

1 个答案:

答案 0 :(得分:0)

这里的a simple perl script或多或少试图做到这一点。

编辑:另请查看the following stackoverflow thread