从文件集重建版本控制

时间:2016-12-08 06:56:41

标签: database git algorithm version controls

我正在为以下任务寻找方法:

给定一组高度相似的文件(我在这里使用模糊散列),我想知道是否有一个算法允许用版本号标记这些文件。输出应该返回生成这些文件的顺序。

原因是我必须重新组织不熟悉版本控制的团队的数据。

谢谢

1 个答案:

答案 0 :(得分:0)

一种相当简单的方法(我希望)是尝试将其转换为某种图形问题。

让我们说每个文件都是一个节点,每两个文件之间有一条边 例如,两个节点之间边缘的权重将是文件之间不同行的数量(或某些其他函数)。

您接下来要做的是找到以最低成本遍历所有文件的非循环路径。类似this的内容,如果您知道第一个文件和最后一个文件 您可以添加一个空文件和最新版本作为 start end 节点。

我猜这不会给你确切的结果,但它可能会给你一个很好的起点。
希望这有用。