我正在为以下任务寻找方法:
给定一组高度相似的文件(我在这里使用模糊散列),我想知道是否有一个算法允许用版本号标记这些文件。输出应该返回生成这些文件的顺序。
原因是我必须重新组织不熟悉版本控制的团队的数据。
谢谢
答案 0 :(得分:0)
一种相当简单的方法(我希望)是尝试将其转换为某种图形问题。
让我们说每个文件都是一个节点,每两个文件之间有一条边 例如,两个节点之间边缘的权重将是文件之间不同行的数量(或某些其他函数)。
您接下来要做的是找到以最低成本遍历所有文件的非循环路径。类似this的内容,如果您知道第一个文件和最后一个文件 您可以添加一个空文件和最新版本作为 start 和 end 节点。
我猜这不会给你确切的结果,但它可能会给你一个很好的起点。
希望这有用。