git - 获取特定文件/文件夹的所有先前版本

时间:2012-10-11 23:17:20

标签: git git-clone git-checkout

我想在git存储库中检索所有以前版本的特定文件。

我看到有可能通过checkout命令获得一个特定版本,但我想要它们全部。带有depth选项的git clone命令似乎不允许我克隆子文件夹(“无效的存储库名称”)。

你知道这是否可能以及如何?

谢谢

6 个答案:

答案 0 :(得分:22)

OP希望检索所有版本,但答案无法提供。特别是如果文件有数百个修订(所有建议都太手册)。 @Tobias在评论中提出了唯一的半工作解决方案,但建议bash循环将以随机顺序构建文件,并且当用于我们的存储库时它会生成数百个空文件。其中一个原因是" rev-list --all --objects"将列出不同的对象(包括树 - 但对我们的目的无用)。

我开始使用Tobias的解决方案,添加了计数器,清理了一下并最终以下面列出的bash脚本的形式重新发明了轮子。

脚本将:
   - 将所有文件版本提取到/ tmp / all_versions_exported
   - 取1个参数 - git repo中文件的相对路径    - 给出结果文件名数字前缀(可排序)
   - 在结果文件中提到检查过的文件名(告诉苹果除了橘子:)    - 在结果文件名中提及提交日期(参见下面的输出示例)
   - 不创建空结果文件

cat / usr / local / bin / git_export_all_file_versions

#!/bin/bash

# we'll write all git versions of the file to this folder:
EXPORT_TO=/tmp/all_versions_exported

# take relative path to the file to inspect
GIT_PATH_TO_FILE=$1

# ---------------- don't edit below this line --------------

USAGE="Please cd to the root of your git proj and specify path to file you with to inspect (example: $0 some/path/to/file)"

# check if got argument
if [ "${GIT_PATH_TO_FILE}" == "" ]; then
    echo "error: no arguments given. ${USAGE}" >&2
    exit 1
fi

# check if file exist
if [ ! -f ${GIT_PATH_TO_FILE} ]; then
    echo "error: File '${GIT_PATH_TO_FILE}' does not exist. ${USAGE}" >&2
    exit 1
fi

# extract just a filename from given relative path (will be used in result file names)
GIT_SHORT_FILENAME=$(basename $GIT_PATH_TO_FILE)

# create folder to store all revisions of the file
if [ ! -d ${EXPORT_TO} ]; then
    echo "creating folder: ${EXPORT_TO}"
    mkdir ${EXPORT_TO}
fi

## uncomment next line to clear export folder each time you run script
#rm ${EXPORT_TO}/*

# reset coutner
COUNT=0

# iterate all revisions
git rev-list --all --objects -- ${GIT_PATH_TO_FILE} | \
    cut -d ' ' -f1 | \
while read h; do \
     COUNT=$((COUNT + 1)); \
     COUNT_PRETTY=$(printf "%04d" $COUNT); \
     COMMIT_DATE=`git show $h | head -3 | grep 'Date:' | awk '{print $4"-"$3"-"$6}'`; \
     if [ "${COMMIT_DATE}" != "" ]; then \
         git cat-file -p ${h}:${GIT_PATH_TO_FILE} > ${EXPORT_TO}/${COUNT_PRETTY}.${COMMIT_DATE}.${h}.${GIT_SHORT_FILENAME};\
     fi;\
done    

# return success code
echo "result stored to ${EXPORT_TO}"
exit 0


用法示例:

cd /home/myname/my-git-repo

git_export_all_file_versions docs/howto/readme.txt
    result stored to /tmp/all_versions_exported

ls /tmp/all_versions_exported
    0001.17-Oct-2016.ee0a1880ab815fd8f67bc4299780fc0b34f27b30.readme.txt
    0002.3-Oct-2016.d305158b94bedabb758ff1bb5e1ad74ed7ccd2c3.readme.txt
    0003.29-Sep-2016.7414a3de62529bfdd3cb1dd20ebc1a977793102f.readme.txt
    0004.28-Sep-2016.604cc0a34ec689606f7d3b2b5bbced1eece7483d.readme.txt
    0005.28-Sep-2016.198043c219c81d776c6d8a20e4f36bd6d8a57825.readme.txt
    0006.9-Sep-2016.5aea5191d4b86aec416b031cb84c2b78603a8b0f.readme.txt
    <and so on and on . . .>

编辑:如果您看到如下错误:

  

致命:不是有效的对象名称   3e93eba38b31b8b81905ceaa95eb47bbaed46494:README.TXT

这意味着您已经从git项目的根文件夹中启动了脚本。

答案 1 :(得分:12)

Dmitry提供的脚本确实解决了这个问题,但它有一些问题导致我对它进行调整以更适合我的需求。具体做法是:

  1. 由于我的默认日期格式设置,git show的使用中断了。
  2. 我希望结果按日期顺序排序,而不是按日期顺序排序。
  3. 我希望能够针对已从repo中删除的文件运行它。
  4. 我不希望所有分支机构都进行所有修订;我只是希望从HEAD可以获得修订。
  5. 如果它不在git repo中,我希望它出错。
  6. 我不想编辑脚本来调整某些选项。
  7. 它的工作方式效率低下。
  8. 我不需要输出文件名中的编号。 (适当格式化的日期用于相同的目的。)
  9. 我想要更安全的“带空格的路径”处理
  10. 您可以看到我的修改in my github repo的最新版本,或者是撰写本文时的版本:

    #!/bin/sh
    
    # based on script provided by Dmitry Shevkoplyas at http://stackoverflow.com/questions/12850030/git-getting-all-previous-version-of-a-specific-file-folder
    
    set -e
    
    if ! git rev-parse --show-toplevel >/dev/null 2>&1 ; then
        echo "Error: you must run this from within a git working directory" >&2
        exit 1
    fi
    
    if [ "$#" -lt 1 ] || [ "$#" -gt 2 ]; then
        echo "Usage: $0 <relative path to file> [<output directory>]" >&2
        exit 2
    fi
    
    FILE_PATH="$1"
    
    EXPORT_TO=/tmp/all_versions_exported
    if [ -n "$2" ]; then
        EXPORT_TO="$2"
    fi
    
    FILE_NAME="$(basename "$FILE_PATH")"
    
    if [ ! -d "$EXPORT_TO" ]; then
        echo "Creating directory '$EXPORT_TO'"
        mkdir -p "$EXPORT_TO"
    fi
    
    echo "Writing files to '$EXPORT_TO'"
    git log --diff-filter=d --date-order --reverse --format="%ad %H" --date=iso-strict "$FILE_PATH" | grep -v '^commit' | \
        while read LINE; do \
            COMMIT_DATE=`echo $LINE | cut -d ' ' -f 1`; \
            COMMIT_SHA=`echo $LINE | cut -d ' ' -f 2`; \
            printf '.' ; \
            git cat-file -p "$COMMIT_SHA:$FILE_PATH" > "$EXPORT_TO/$COMMIT_DATE.$COMMIT_SHA.$FILE_NAME" ; \
        done
    echo
    
    exit 0
    

    输出的一个例子:

    $ git_export_all_file_versions bin/git_export_all_file_versions /tmp/stackoverflow/demo
    Creating directory '/tmp/stackoverflow/demo'
    Writing files to '/tmp/stackoverflow/demo'
    ...
    
    $ ls -1 /tmp/stackoverflow/demo/
    2017-05-02T15:52:52-04:00.c72640ed968885c3cc86812a2e1aabfbc2bc3b2a.git_export_all_file_versions
    2017-05-02T16:58:56-04:00.bbbcff388d6f75572089964e3dc8d65a3bdf7817.git_export_all_file_versions
    2017-05-02T17:05:50-04:00.67cbdeab97cd62813cec58d8e16d7c386c7dae86.git_export_all_file_versions
    

答案 2 :(得分:4)

git rev-list --all --objects -- path/to/file.txt

列出与repo路径关联的所有blob

获取文件的特定版本

git cat-file -p commitid:path/to/file.txt

(commitid可以是任何东西

  • 符号引用(分支,标记名称;远程也是)
  • 提交哈希
  • 修订规范,如HEAD~3,branch1 @ {4}等。

答案 3 :(得分:0)

有时文件的旧版本只能通过git reflog获得。我最近有一种情况需要深入了解所有提交,即使是因为在交互式变基期间意外覆盖而不再是日志的一部分。

我编写了这个Ruby脚本来输出该文件的所有先前版本以查找孤立提交。很容易grep这个输出来追踪我丢失的文件。希望它可以帮到某人。

#!/usr/bin/env ruby
path_to_file = ""
`git reflog`.split("\n").each do |log|
   puts commit = log.split(" ").first
   puts `git show #{commit}:#{path_to_file}`
   puts
 end

使用git log可以完成同样的事情。

答案 4 :(得分:0)

答案 5 :(得分:-2)

当你git克隆它时,文件的所有版本都已经在git repo中了。您可以创建与特定提交的签出相关联的分支:

git checkout -b branchname {commit#}

这可能足以快速和脏手动比较变化:

  • 结帐分行
  • 复制到编辑器缓冲区

这可能没问题,如果你只关心几个版本,并且不介意一些手动的,虽然是git内置命令。

对于脚本化解决方案,其他答案中已经提供了其他一些解决方案。