RStudio项目是否存储任何临时数据?

时间:2019-04-08 08:06:32

标签: r rstudio project confidentiality

我正在使用RStudio项目处理机密数据(即与工作目录相关联的项目,而非版本控制)。我想与协作者共享我的脚本confidential_script.R和项目confidential_project.Rproj,而不共享任何真实数据,包括临时文件或元数据。我确保不保存或共享任何.RData文件。但是,Windows中的RStudio会自动创建看起来像项目元数据的.Rproj.user隐藏文件夹。

我可以在不破坏任何机密信息的情况下共享RStudio项目文件吗?

1 个答案:

答案 0 :(得分:0)

管理机密依赖项的最佳方法是在脚本顶部将它们声明为R对象,并消除共享R项目或RStudio项目等元数据文件的需要。

理想情况下,可以创建一个包含随机/匿名数据的机密信息的测试版本,开发一些测试/报告以进行验证,并在R脚本中包含这些项目,以便其他协作者可以确保将其与实时数据。

脚本,参数,测试数据和测试用例使脚本完全可重复。

示例:下载并合并神奇宝贝统计数据文件

以下示例脚本下载了神奇宝贝前七代的统计信息,并将其组合到单个数据框中以进行后续分析。

# name of zip file assigned to theZipFile object
theZipFile <- "https://raw.githubusercontent.com/lgreski/pokemonData/master/pokemonData.zip"

download.file(theZipFile,
              "pokemonData.zip",
              method="curl",mode="wb")
unzip("pokemonData.zip")

thePokemonFiles <- list.files("./pokemonData",
                              full.names=TRUE)
thePokemonFiles 

pokemonData <- lapply(thePokemonFiles,function(x) read.csv(x))

# a list of 7 data frames
summary(pokemonData)

pokemonData <- do.call(rbind,pokemonData)

summary(pokemonData)