开始使用Git Python

时间:2012-01-04 09:00:34

标签: python git dulwich

我的目标是从Python访问现有的Git回购。我想获得回购历史和按需差异。

为了做到这一点,我从dulwich开始。所以我试过了:

from dulwich.repo import Repo
Repo.init('/home/umpirsky/Projects/my-exising-git-repo')

得到OSError: [Errno 17] File exists: '/home/umpirsky/Projects/my-exising-git-repo/.git

docYou can open an existing repository or you can create a new one.

知道怎么做吗?我可以用德威获取历史和差异吗?你能推荐任何其他lib用于Git访问吗?我正在开发Ubuntu应用程序,因此可以选择使用ubuntu软件包以便于部署。

我还会定期检查以检测repo中的新变化,因此我宁愿使用远程操作,因此我可以检测到尚未转移到本地的更改。我不确定这应该如何运作,所以任何帮助都会得到满足。

提前致谢。

2 个答案:

答案 0 :(得分:6)

我认为init方法用于创建一个新的存储库,打开一个现有的存储库,只需这样传递路径:

from dulwich.repo import Repo
repo = Repo(<path>)

有关替代库的摘要,请查看此answer。基本上,它表明使用subprocess模块更容易,因为它是使用您已知的界面的最佳方式。

答案 1 :(得分:3)

Dulwich的大多数文档都假定您对Git文件格式/协议有相关的了解。

您应该可以使用Repo打开现有存储库:

from dulwich.repo import Repo
x = Repo("/path/to/git/repo")

或创建一个新的:

x = Repo.init("/path/to/new/repo")

获取特定提交的差异(具有第一个父级的差异)

from dulwich.patch import write_tree_diff
commit = x[commit_id]
parent_commit = x[commit.parents[0]]
write_tree_diff(sys.stdout, x.object_store, parent_commit.tree, commit.tree)

Git协议只允许提取/发送包,它不允许直接访问数据库中的特定对象。这意味着要检查远程存储库,首先必须从远程仓库获取相关提交,然后您可以查看它们:

from dulwich.client import get_transport_and_path
client, path = get_transport_and_path(remote_url)
remote_refs = client.fetch(path, x)
print x[remote_refs["refs/heads/master"]]