从GitHub历史记录中删除数据集

时间:2020-04-28 07:52:28

标签: git github version-control repository bfg-repo-cleaner

我知道这个问题可能之前已经发布过,但是我有点困惑。

我正在做一个小组项目,我们使用的数据集是机密的。到目前为止,我们一直在使用私有存储库,并且在删除数据集(多个文件)之后希望将其公开。

  • 我担心的是,由于所有这些单独的文件都是在不同的时间点创建的,因此需要采取哪些必要步骤才能从历史记录中删除所有这些文件。这些文件已经过多次调整和更新。

  • 由于还用相同的PR / Commit修改了其他文件,因此会对它们有影响吗?

P.S。我已经考虑过删除该存储库并创建一个新的存储库,但是我希望保留我的开发历史记录。

我看过BFG,听起来像是完成这项工作的正确工具,但是我不确定我所理解的是否正确。

这是我想做的:

store.add(phon.data['Name'])

然后在回购的镜像中运行BFG:

  rm <filename1>
  rm <filename2>
  git commit -A "removed x files"
  git push

这是正确的方法吗?任何帮助将不胜感激。

0 个答案:

没有答案
相关问题