查找包含多个特定提交的Git提交

时间:2012-12-18 17:59:31

标签: git git-branch git-log git-rev-list

一般问题:在给定一组提交的情况下,如何找到包含所有这些提交的提交列表作为祖先,或相关地,包含所有这些提交的第一个提交。

我可以通过查找git branch --contains <commit>为集合中的所有提交返回的分支来查找包含提交的分支(类似标记),但git rev-list没有{{1 }} 选项。实际上,我正在寻找一种方法将常规--contains参数与--contains相结合,并将输出限制为包含 all 列出的提交的提交,而不是任何一个它们(这是git rev-list正常工作的方式)。

具体示例:在提交--containsab的情况下,如何找到第一个在其祖先中拥有所有三个提交的提交?< / p>

例如,给定下面的树,我如何找到标记为X的提交?

c

我认为我可以使用* (master) | X |\ a * | | b c |/ * | * 做一些魔术,并且可能涉及git rev-list符号,但我无法解决这个问题。

3 个答案:

答案 0 :(得分:2)

我想这个问题的答案是git不是为此而做的。 Git真的不喜欢“承诺的孩子”的想法,并且有一个很好的理由:它没有很好的定义。因为提交不知道它的孩子,这是一个非常模糊的集合。您可能实际上并没有在您的仓库中拥有所有分支,因此缺少一些孩子。

Gits内部存储结构也使得查找提交的子项成本相当昂贵,因为您必须将所有头的修订图表移动到相应的根目录,或者直到您看到所有想要了解其子项的提交

git支持的唯一概念是一个提交包含另一个提交的想法。但是这个功能只有很少的git命令支持(git branch就是其中之一)。并且git支持它,它不支持任意提交,但只支持分支头。

这一切似乎都是git的一个相当严格的限制,但在实践中,事实证明你不需要提交的“子”,但通常只需要知道哪些分支包含特定的提交。


所有人都说:如果你真的想得到问题的答案,你必须编写自己的脚本来找到它。最简单的方法是从git rev-list --parents --reverse --all的输出开始。逐行解析,您将构建一个树,并为每个节点标记它是否是您正在寻找的提交的子项。你通过在提交后自己标记提交,然后将该属性传递给他们所有的孩子等来实现这一点。

如果您的提交被标记为包含所有提交,则将其添加到“解决方案列表”并将其所有子项标记为 dead - 它们不能再包含任何首次提交。然后,该属性也将传递给它的所有后代。

如果您不存储不包含您要求的任何提交的树的任何部分,则可以在此处节省一些内存。


编辑黑客攻击一些python代码

#!/usr/bin/python -O
import os
import sys

if len(sys.argv) < 2:
    print ("USAGE: {0} <list-of-revs>".format([sys.argv[0]]))
    exit(1)

rev_list = os.popen('git rev-list --parents --reverse --all')

looking_for = os.popen('git rev-parse {0}'
                       .format(" ".join(sys.argv[1:]))).read().splitlines()
solutions = set()
commits = {}

for line in rev_list:
    line = line.strip().split(" ")
    commit = set()
    sha = line[0]
    for parent in line[1:]:
        if not parent in commits:
            continue
        commit.update(commits[parent])
        if parent in solutions:
            commit.add("dead")
    if sha in looking_for:
        commit.add(sha)
    if not "dead" in commit and commit.issuperset(looking_for):
        solutions.add(sha)
    # only keep commit if it's a child of looking_for
    if len(commit) > 0:
        commits[sha] = commit

print "\n".join(solutions)

答案 1 :(得分:1)

一种可能的解决方案:

使用'git merge-base a b c'来提交用作调用rev-list的起点;我们称之为$ MERGE_BASE。

使用'git rev-list $ MERGE_BASE..HEAD'调用列出从其共同祖先到HEAD的所有提交。循环遍历此输出(伪代码):

if commit == a || b || c
  break
else 
  $OLDEST_DESCENDANT = commit
return $OLDEST_DESCENDANT

这将适用于上面的示例,但如果它们从未被合并,则会在最小的a,b,c之后立即合并,或者如果有多个合并提交带来,则会给出误报a,b和c一起(如果他们各自居住在他们自己的分支上)。找到最老的后代还有一些工作要做。

然后,您应该按照上面的内容开始使用$ OLDEST_DESCENDANT,然后在DAG中向后转向HEAD(rev-list --reverse $ OLDEST_DESCENDANT~..HEAD),测试看看'rev-的输出list $ MERGE_BASE~ .. $ OLDEST包含所有需要的提交a,b和c(可能有更好的方法来测试它们是否可以比rev-list访问)。

正如twalberg所提到的,像这样单独测试提交似乎不是最佳和缓慢,但它是一个开始。这种方法优于其合并提交列表方法,因为当所有输入提交位于同一分支上时,它将提供有效的响应。

性能主要受合并基础,头部,X和所需提交集(a,b和c)中最年轻的距离之间的距离影响。

答案 2 :(得分:-1)

怎么样:

MERGE_BASE=`git merge-base A B C`
git log $MERGE_BASE...HEAD --merges

假设您只有1次合并。即使您有更多合并,最旧的合并也包含来自所有三个提交的更改