对大量类似文件执行diff

时间:2014-04-02 10:48:32

标签: diff

我刚刚被客户交出了40个html文件,这些文件与微小的变化完全相同。有没有办法区分所有文件,看看特定区域的任何地方是否有变化?

2 个答案:

答案 0 :(得分:0)

我有类似的情况,我将使用git来提取差异。可以将原始提交与最后一个提交进行比较,每个文件都是单独提交的。它们都必须被命名为相同,并且因为我的日期是基于日期的,所以我将把日期移到文件中进行跟踪。

答案 1 :(得分:0)

你不想要差异;你想要一个克隆检测工具。

这样的工具可以说明文件集的共同点,并且可以(可以说)被考虑在内。这种工具的一个很好的版本将告诉共性是精确的还是有一些变化点,并将识别变异点和变异点所采用的不同值。

我们的CloneDR工具可以执行此操作,使用精确的语言解析器。它将在一组文件中找到共性,生成一组" clone"示例(diff必须成对运行,对于N个文件是O(N ^ 2))。这意味着在语言结构边界上识别共性(与差异相反,差异表示文本行的术语不同)。如果语言结构的含义相同,即使一个文件中的代码的格式/布局与另一个文件中的代码的格式/布局不同,也意味着检测到共性。该网站提供了大量样本报告,显示了各种语言的典型结果。