我不熟悉DVC,只是对其进行了探索。我试图从s3中提取数据,而该数据是由我团队中另一个人推送的。但我收到此错误:
WARNING: Some of the cache files do not exist neither locally nor on remote. Missing cache files:
name: head_test_file.csv, md5: 45db668193ba44228d61115b1d0304fe
WARNING: Cache '45db668193ba44228d61115b1d0304fe' not found. File 'head_test_file.csv' won't be created.
No changes.
ERROR: failed to pull data from the cloud - Checkout failed for following targets:
head_test_file.csv
Did you forget to fetch?
答案 0 :(得分:2)
我的错误。我跑了dvc add
,但我错过了跑dvc push
的机会。运行此修复程序。
当我运行dvc add
时,它做了create my_file.csv.dvc
个文件,但没有被推送。因此,当我尝试拉时,它看到了.dvc文件,但感到困惑。
这是一个简单的解决方案,但我花了一些时间才弄清楚。由于这是一种新工具,因此可以提出并回答我自己的问题,以防其他人犯同样的错误。
答案 1 :(得分:0)
您可能需要运行dvc install
,该安装了Git钩子以在dvc push
之后自动git push
(:
推送:在使用git push向Git远程发布更改时,很容易忘记dvc push命令对于将DVC跟踪的新的或更新的数据文件和目录上传到远程存储是必需的。
此挂钩可自动执行dvc推送。