在DVC中更新跟踪的目录

时间:2019-05-24 03:10:22

标签: dvc

根据this tutorial,当我更新文件时,我应该先从DVC控制下删除文件(即执行dvc unprotect <myfile>.dvcdvc remove <myfile>.dvc),然后通过dvc add <mifile>重新添加。但是,不清楚是否应该对目录应用相同的工作流程。

我在DVC的控制下具有以下结构的目录:

data/
    1.jpg
    2.jpg

每次目录内容更新时,我都应该运行dvc unprotect data吗?

更具体地说,我对是否应该在以下用例中运行dvc unprotect data感兴趣:

  • 已添加新文件。例如,如果我将3.jpg图片放在数据目录中
  • 文件已删除。例如,如果我删除了2.jpg目录中的data图像
  • 文件已更新。例如,如果我通过图形编辑器编辑1.jpg图像。
  • 先前使用案例的组合(即,一些文件已更新,其他文件已删除并添加了新文件)

1 个答案:

答案 0 :(得分:2)

仅在文件更新后-即,仅在启用hadrlink或symlink缓存类型的情况下,使用编辑器 AND 编辑1.jpg

请检查此link

  

在DVC配置选项cache.type设置为硬链接或/和符号链接时,必须谨慎执行更新跟踪文件的操作,以避免数据损坏

我强烈建议您阅读本文档:Performance Optimization for Large Files解释了使用硬链接/符号链接的好处。