Git存储库内部格式解释

时间:2011-11-25 09:15:24

标签: c# git github libgit2 libgit2sharp

是否有关于Git如何在其存储库中存储文件的文档?我试图通过互联网搜索,但没有可用的结果。也许我正在使用不正确的查询或者这可能是一个很大的秘密 - Git存储库内部格式?

让我解释一下,为什么我需要这个火箭科学信息:我正在使用C#来获取文件历史表格存储库。但是在libgit2sharp库中,它目前尚未实现。所以(作为一个负责任的人;)我需要自己实现这个功能,并为社区做出贡献。

但是在将内核源代码移到github后,我甚至不知道从哪里开始搜索。

非常感谢提前!

1 个答案:

答案 0 :(得分:40)

存储库的内部格式非常简单。 Git本质上是一个内容可寻址的用户空间文件系统。

这是一个缩略图。

物件

Git将其内部数据结构存储为objects。有四种对象:blob(有点像文件),树(有点像目录),提交(特定时间点文件系统的快照以及如何到达那里的信息)和标签(指向提交的指针)用于标记重要的)。

如果您查看存储库的.git目录,您将找到一个objects目录,其中包含由SHA-1哈希命名的文件。它们中的每一个都代表一个对象您可以使用plumbing git cat-file命令检查它们。来自我的某个存储库的示例提交对象

noufal@sanitarium% git cat-file -p 7347addd901afc7d237a3e9c9512c9b0d05c6cf7
tree c45d8922787a3f801c0253b1644ef6933d79fd4a
parent 4ee56fbe52912d3b21b3577b4a82849045e9ff3f
author Noufal Ibrahim <noufal@..> 1322165467 +0530
committer Noufal Ibrahim <noufal@..> 1322165467 +0530

Added a .md extension to README

您还可以在.git/objects/73/47addd901afc7d237a3e9c9512c9b0d05c6cf7看到对象本身。

你可以检查这样的其他对象。每个提交都指向一个树,该树表示该时间点的文件系统,并且具有一个(或者在合并提交的情况下更多)父。

对象存储为objects目录中的单个文件。这些被称为松散物体。当您运行git gc时,将修剪无法再访问的对象,并将其余对象打包到一个文件中并进行增量压缩。这样可以提高空间效率并压缩存储库。运行gc后,您可以查看.git/objects/pack/目录以查看git packfiles。要解压缩它们,可以使用plumbing命令git unpack-objects命令。 .git/objects/info/packs文件包含当前存在的包文件列表。

参考

您需要知道的下一件事是参考资料。这些是指向某些提交或对象的指针。您的分支和其他此类内容将作为参考实现。有两种“真实”(它们类似于文件系统中的硬链接)和“符号”(它们是指向真实引用的指针 - 如符号链接)。

这些位于.git/refs目录中。例如,在上面的存储库中,我在master分支上。我的最新提交是

noufal@sanitarium% git log -1
commit 7347addd901afc7d237a3e9c9512c9b0d05c6cf7
Author: Noufal Ibrahim <noufal@...>
Date:   Fri Nov 25 01:41:07 2011 +0530

    Added a .md extension to README

您可以看到位于master的{​​{1}}引用指向此提交。

.git/refs/heads/master

当前分支存储在位于noufal@sanitarium% more .git/refs/heads/master 7347addd901afc7d237a3e9c9512c9b0d05c6cf7 的符号引用HEAD中。这是

.git/HEAD

如果你切换分支,它会改变。

类似地,标签也是这样的引用(但它们不像分支那样是可移动的)。

整个存储库仅使用提交的DAG(每个提交指向一个表示某个时间点的文件的树)进行管理,并且引用指向DAG上的各种提交,以便您可以操作它们。

进一步阅读

  • 我有一个演示文稿,我用于我的git培训here,解释了其中的一些内容。
  • http://book.git-scm.com/上的社区图书有一些关于内部的部分。
  • Scott Chacon的Pro Git书中有一节internals
  • 他的内部也有一个peepcode PDF