database - 从文件集重建版本控制

时间：2016-12-08 06:56:41

标签： database git algorithm version controls

我正在为以下任务寻找方法：

给定一组高度相似的文件（我在这里使用模糊散列），我想知道是否有一个算法允许用版本号标记这些文件。输出应该返回生成这些文件的顺序。

原因是我必须重新组织不熟悉版本控制的团队的数据。

谢谢

答案 0 :(得分：0)

一种相当简单的方法（我希望）是尝试将其转换为某种图形问题。

让我们说每个文件都是一个节点，每两个文件之间有一条边例如，两个节点之间边缘的权重将是文件之间不同行的数量（或某些其他函数）。

您接下来要做的是找到以最低成本遍历所有文件的非循环路径。类似this的内容，如果您知道第一个文件和最后一个文件您可以添加一个空文件和最新版本作为 start 和 end 节点。

我猜这不会给你确切的结果，但它可能会给你一个很好的起点。
希望这有用。