我想知道处理在以下情况下创建的 descriptorfile (foo.desc
)和 backingfile (foo.bin
)的最佳实践是什么?使用read.big.matrix(...)
foo.csv
据我所知,后备文件默认情况下是RDS文件,而 descriptorfile 是纯文本文件。因此,从理论上讲,它们都是跨平台的并且可以检入,但是我的猜测是 backingfile 会发生很大变化,因此应由版本控制忽略。有人在这里有经验吗?
答案 0 :(得分:1)
后备文件不是RDS文件。这只是一个简单的二进制文件,应该是跨平台的。
通常不建议对二进制文件进行版本控制,因为它们会发生很大变化。而且,这是一个大文件,因此不建议使用。
描述符文件本身是无用的。
因此,我建议不要对那些文件进行版本控制。 唯一的情况是您仅使用小文件作为示例(请参见https://github.com/privefl/bigstatsr/tree/master/inst/extdata)。