使用diff来查找许多相同文件的部分? (bizzaro-diff,或反差异)

时间:2009-02-06 21:20:24

标签: html diff inverse

Bizzaro的Diff !!!

有没有做一个bizzaro / inverse-diff只显示一组相同文件的部分? (I.E.方式超过three files

奇怪的问题,我知道......但我正在将某人古老的静态页面转换成a little more manageable

4 个答案:

答案 0 :(得分:1)

您可以尝试 comm 命令(对于常用)。它一次只能比较2个文件,但你应该可以通过一些聪明的脚本来做3+。

答案 1 :(得分:1)

您可以尝试sim。我使用它已经过了几年,但我记得它在查找文件或许多不同文件中的相似性时非常有用。

答案 2 :(得分:1)

你想要一个克隆探测器。它会检测到类似的代码块 大型系统。 请参阅我们的ClonedR工具:http://www.semdesigns.com/Products/Clone/index.html

答案 3 :(得分:0)

这是classic problem

如果我不得不快速弄脏它,我可能会做一些像diff -U 1000000(假设支持它的差异版本),通过sed传输以获得共同的线条(和条带)领先的空间)。但是,您必须遍历所有文件。

编辑:我忘记了Tcl implementation也会稍微多功能,但需要更多编码。您可能能够找到所选语言的实现。