使用gitpython

时间:2019-04-12 16:57:40

标签: python git git-log gitpython

在python中,我想获取git存储库中文件的所有提交日志,并解析日志中的信息(哈希,作者姓名,作者邮件,作者日期,提交者名称,提交者邮件,提交日期和提交消息)。目前,我可以使用gitpython或通过子进程调用shell命令来获取原始git日志。

使用gitpython:

g=git.Git(path)
loginfo=g.log("--pretty=fuller",'--follow',"<filename>")

使用子过程调用:

lines = subprocess.check_output(
        ['git', 'log','--follow',"--pretty=fuller"," 
         <filename"],stderr=subprocess.STDOUT)

但是,在那之后,我想解析原始日志,但是无法在gitpython中找到合适的库/方法。另外,我也希望日期也以python datetime格式进行解析。你能帮忙吗?

2 个答案:

答案 0 :(得分:1)

您可以使用以下方法获取所有存储库提交:

import git
repo = git.Repo("/home/user/.emacs.d")
commits = list(repo.iter_commits("master", max_count=5)))

然后您可以确定自己gitpython提供的数据类型:

dir(commmits[0])

其中一些是

  • 作者
  • committed_datetime
  • hexsha
  • 消息
  • 统计

举个例子:

>>> commits[0].author
<git.Actor "azzamsa <foo@bar.com>">

>>> commits[0].hexsha
'fe4326e94eca2e651bf0081bee02172fedaf0b90'

>>> commits[0].message
'Add ocaml mode\n'

如果您要检查提交是否包含文件(如果 您想从该文件中获取所有提交)。您可以使用:

def is_exists(filename, sha):
    """Check if a file in current commit exist."""
    files = repo.git.show("--pretty=", "--name-only", sha)
    if filename in files:
        return True

然后从文件中获取所有提交:

def get_file_commits(filename):
    file_commits = []
    for commit in commits:
        if is_exists(filename, commit.hexsha):
            file_commits.append(commit)

    return file_commits

例如,我要从“ init.el”文件中获取所有提交:

initel_file_commits = get_file_commits('init.el')

>>> initel_file_commits
[<git.Commit "fe4326e94eca2e651bf0081bee02172fedaf0b90">, <git.Commit
"e4f39891fb484a95ea76e8e07244b908e732e7b3">]

确保该功能正常工作:

>>> initel_file_commits[0].stats.files
{'init.el': {'insertions': 1, 'deletions': 0, 'lines': 1}, 'modules/aza-ocaml.el': {'insertions': 28, 'deletions': 0, 'lines': 28}}

>>> initel_file_commits[1].stats.files
{'init.el': {'insertions': 1, 'deletions': 0, 'lines': 1}, 'modules/aza-calfw.el': {'insertions': 65, 'deletions': 0, 'lines': 65}, 'modules/aza-home.el': {'insertions': 0, 'deletions': 57, 'lines': 57}}

希望有帮助。

答案 1 :(得分:0)

您可以考虑使用PyDriller,它是GitPython的包装,使这些事情变得更容易。有一个名为get_commits_modified_file()的函数:

gr = GitRepository("repo_path")
commits = gr.get_commits_modified_file("filepath") # this return a list of commits hash

那么您可以做:

for commit in RepositoryMining("repo_path", only_commits=commits).traverse_commits():
    # your code here