Git:查找仅更改了serialVersionUID的文件

时间:2019-03-04 14:56:10

标签: java git git-diff

我有一组自动生成的Java文件,它们被检入git。每个文件都包含

final static long serialVersionUID = -4268385597939353497L;

其中,每次重新生成后,serialVersionUID之后的部分均更改为随机数。

注意:这是一成不变的,我知道“不将生成的代码检入版本控制等”。

如何识别所有仅 serialVersionUID更改的文件? 已更改表示文件已在工作副本中被修改,但尚未提交。

我的目标是通过预提交钩子还原这些文件。

我走得远

git diff -U10000 --raw MyFile.java

这使我对整个文件有所了解 或

git diff -U0 --raw --word-diff=porcelain MyFile.java

这给了我一个“差异标题”以及更改列表。

1 个答案:

答案 0 :(得分:1)

注意:这个特定的StackOverflow答案不能解决您的问题(由于我没有Java解析器,因此我实际上不能正确解决它)。这是您将要遇到的所有 other 绊脚石,以及如何避免这些绊脚石,以便您的任务实际上只是与Java相关的部分。

请务必注意,这里每个文件都有三个副本:

  • 您当前提交的内容HEAD:MyFile.java(使用git show HEAD:MyFile.java查看此内容);
  • 建议的下一次提交中的一个,:MyFile.java(再次使用git show进行查看);和
  • 您的工作树中的一个MyFile.java,您可以直接查看和编辑。

git diff命令通常会从三个中的两个中选择一个。

不带任何参数或仅选择一个文件(而不是提交)的参数运行git diff,将文件的 index 副本与 work-tree < / em>复制。它不会提取当前提交的文件。索引副本是git commit将写入到 new 提交中的副本,因此实际上就是您打算立即提交的内容。

使用git diff --cached告诉Git将HEAD中的文件与索引中的文件进行比较。使用git diff HEAD告诉Git将HEAD中的文件与工作树中的文件进行比较。因此,这些都是您选择要比较哪些文件的的方法。但是无论如何,每个git diff只会选择一个个文件,或者如果让Git比较所有文件则选择一个对。

如果您运行git commit -a(我建议您不要,在这里),则与git add -u && git commit大致相同,不同之处在于它会使用更新后的内容建立临时索引文件。由于现在存在多个具有不同的protocol-next-commits的不同索引文件,因此在各个commit挂钩中,事情变得特别棘手。因此,我建议在这里避免使用git commit -a。使用文件的三个副本并使用棘手的提交选项(例如-a--only--include)已经足够困难,并要进行推理。将第四套甚至第五套副本投入混合。

(Git一次只能处理一个索引文件。标准git commit仅具有一个标准索引文件。标准索引文件具有将要或将要进行下一次提交的文件的副本。 1 这些选项使Git创建其他临时索引​​文件,并在其中构建建议的新提交,然后在环境中设置$GIT_INDEX_FILE的情况下运行其余操作(包括您的钩子)使这些子命令可以查看将要使用的临时索引。如果一切顺利,并且git commit结束进行新提交,则这些临时索引文件之一,其内容根据选项而适当和参数,成为新索引,之后,您只需回到每个文件只有三个副本即可恢复正常状态。)

由于您的计划是在预提交挂钩中工作,因此您可能应该HEAD文件与索引中建议提交的文件进行比较,即,您应该可能在这里使用git diff --cached。但是,如果您打算通过计算机程序进行此操作,而不是像人类在闲暇时阅读的内容那样,则根本不应该使用git diff。前端git diff命令供人类使用,这就是为什么它对输出进行分页和着色并执行所有使计算机程序烦恼的事情。 Git称这些花哨的前端为瓷器命令

每种git diff都是通过后端 plumbing 命令实现的。将提交(技术上是 tree )与索引进行比较的管道命令是git diff-index,它仍然需要--cached来告诉它进行所需的比较:{{1 }}产生可预测的输出,而与每个用户的首选寻呼机,颜色样式等无关。

(如果您是专门为自己使用而编写此挂钩,则可以使用git diff-index --cached HEADgit diff,因为您可以补偿自己的个人git diff-index设置。但这更好。 ,从某种意义上说,无论如何都使用管道命令-则无需进行任何补偿。)

无论您在这里选择什么,都仍然必须编写自己的代码来解释diff输出。您可能改为选择编写一个程序,该程序仅从当前提交和索引中提取感兴趣的两个文件{git diffHEAD:MyFile.java,然后在您自己的程序中进行比较比根本不使用:MyFile.java。您可以使用git diff提取文件,但是有一点缺陷,那就是它是另一个瓷器命令。您可以使用基础管道命令git show直接提取文件,而无需通过git cat-file -p

实际上,解析Java代码将是最可靠的方法,这样您就不会因某种愚蠢的格式更改而烦恼。一种更加棘手的方法,例如假设某种形式的一行除外,所有内容都必须匹配,例如,awk不太困难(一次读取两个文件,请检查两个文件中只有一行是不同的)文件,并具有预期的形式)。所有这些似乎都比尝试解析diff输出要简单,尽管如果要解析diff输出,非Git非上下文diff可能会更简单。

最后,关于:

  

我的目标是通过预提交钩子还原这些文件。

可以做到这一点(对于某些“正确”的定义,Git会正确处理),但是对于许多Git用户来说也有些令人惊讶。像这样的Git钩子不应该更改。人们编写Git的意图是为了使Git钩子像这样 verify 。如果某项未通过验证步骤,则该挂钩应退出非零值,这将导致git show停止。任何修复都应该通过一些非挂钩操作完成。

请注意,git commit 完全跳过预提交挂钩。


1 从技术上讲,索引具有对每个文件的只读副本的引用。因为这些副本是只读的,所以可以共享它们。因此“复制”索引很便宜,因为它实际上只是复制所有引用。此外,提议的新提交中的每个文件与某个现有提交中的文件的每个位100%逐位相同,实际上只是对该文件的引用,因为每个提交中存储的每个文件本身都是完全可读的-