在python中,我想获取git存储库中文件的所有提交日志,并解析日志中的信息(哈希,作者姓名,作者邮件,作者日期,提交者名称,提交者邮件,提交日期和提交消息)。目前,我可以使用gitpython或通过子进程调用shell命令来获取原始git日志。
使用gitpython:
g=git.Git(path)
loginfo=g.log("--pretty=fuller",'--follow',"<filename>")
使用子过程调用:
lines = subprocess.check_output(
['git', 'log','--follow',"--pretty=fuller","
<filename"],stderr=subprocess.STDOUT)
但是,在那之后,我想解析原始日志,但是无法在gitpython中找到合适的库/方法。另外,我也希望日期也以python datetime格式进行解析。你能帮忙吗?
答案 0 :(得分:1)
您可以使用以下方法获取所有存储库提交:
import git
repo = git.Repo("/home/user/.emacs.d")
commits = list(repo.iter_commits("master", max_count=5)))
然后您可以确定自己gitpython提供的数据类型:
dir(commmits[0])
其中一些是
举个例子:
>>> commits[0].author
<git.Actor "azzamsa <foo@bar.com>">
>>> commits[0].hexsha
'fe4326e94eca2e651bf0081bee02172fedaf0b90'
>>> commits[0].message
'Add ocaml mode\n'
如果您要检查提交是否包含文件(如果 您想从该文件中获取所有提交)。您可以使用:
def is_exists(filename, sha):
"""Check if a file in current commit exist."""
files = repo.git.show("--pretty=", "--name-only", sha)
if filename in files:
return True
然后从文件中获取所有提交:
def get_file_commits(filename):
file_commits = []
for commit in commits:
if is_exists(filename, commit.hexsha):
file_commits.append(commit)
return file_commits
例如,我要从“ init.el”文件中获取所有提交:
initel_file_commits = get_file_commits('init.el')
>>> initel_file_commits
[<git.Commit "fe4326e94eca2e651bf0081bee02172fedaf0b90">, <git.Commit
"e4f39891fb484a95ea76e8e07244b908e732e7b3">]
确保该功能正常工作:
>>> initel_file_commits[0].stats.files
{'init.el': {'insertions': 1, 'deletions': 0, 'lines': 1}, 'modules/aza-ocaml.el': {'insertions': 28, 'deletions': 0, 'lines': 28}}
>>> initel_file_commits[1].stats.files
{'init.el': {'insertions': 1, 'deletions': 0, 'lines': 1}, 'modules/aza-calfw.el': {'insertions': 65, 'deletions': 0, 'lines': 65}, 'modules/aza-home.el': {'insertions': 0, 'deletions': 57, 'lines': 57}}
希望有帮助。
答案 1 :(得分:0)
您可以考虑使用PyDriller,它是GitPython的包装,使这些事情变得更容易。有一个名为get_commits_modified_file()
的函数:
gr = GitRepository("repo_path")
commits = gr.get_commits_modified_file("filepath") # this return a list of commits hash
那么您可以做:
for commit in RepositoryMining("repo_path", only_commits=commits).traverse_commits():
# your code here