我试图在R包中包含(有些)大数据集。在Rstudio检查期间我一直收到警告,说我可以通过压缩来节省空间:
* checking data for ASCII and uncompressed saves ... WARNING
Note: significantly better compression could be obtained
by using R CMD build --resave-data
old_size new_size compress
slp.rda 499Kb 310Kb bzip2
sst.rda 1.3Mb 977Kb xz
我尝试将-- resave-data
添加到RStudio"配置Buid工具"没有效果。
答案 0 :(得分:7)
use_data
函数save
获取压缩类型的参数,并且通常可以更轻松地向pkgs添加数据。使用它,或仅使用xz
自己),在保存数据时使用save
压缩(对于compression_level
,它是--resave-data
参数)。
如果您想使用--resave-data=best
,那么您可以尝试--resave-data
,因为只使用gzip
默认为Before
IntentIntent
Created
Creating URI Stuff....
Directory creation
IMG_ONE created...
0
Before Intent
Intent Created
Creating URI Stuff....
Directory creation
IMG_ONE created...
1
Before Intent
Intent Created
Creating URI Stuff....
Directory creation
IMG_ONE created...
2
(在这种情况下几乎没有任何东西)。
有关详细信息,请参阅Building package tarballs。
答案 1 :(得分:2)
另一种选择,如果您有一个不想重新创建的大型数据集,则使用R中的tools::resaveRdaFiles
。将其指向数据集文件或整个数据目录,然后将其指向将以您选择的格式压缩您的数据。有关详细信息,请参阅其manual page。