如何使用R从磁盘读取加密文件

时间:2014-08-14 22:50:03

标签: r encryption privacy

我有一个敏感的数据集,永远不应该以未加密的方式存储在磁盘上。 R可以处理这个或者是全盘加密我唯一的选择吗?

1 个答案:

答案 0 :(得分:13)

我觉得有一种更简单的方法可以做到这一点,但digest包进行AES加密,是我遇到的最接近你要求的东西。这应该可以帮到你。

# write encrypted data frame to file
write.aes <- function(df,filename, key) {
  require(digest)
  zz <- textConnection("out","w")
  write.csv(df,zz, row.names=F)
  close(zz)
  out <- paste(out,collapse="\n")
  raw <- charToRaw(out)
  raw <- c(raw,as.raw(rep(0,16-length(raw)%%16)))
  aes <- AES(key,mode="ECB")
  aes$encrypt(raw)
  writeBin(aes$encrypt(raw),filename)  
}
# read encypted data frame from file
read.aes <- function(filename,key) {
  require(digest)
  dat <- readBin(filename,"raw",n=1000)
  aes <- AES(key,mode="ECB")
  raw <- aes$decrypt(dat, raw=TRUE)
  txt <- rawToChar(raw[raw>0])
  read.csv(text=txt)
}   
# sample data
set.seed(1)     # for reproducible example
data <- data.frame(x=rnorm(10),y=rpois(10,1),
                   z=letters[1:10],w=sample(T:F,10,replace=T))    

set.seed(123581321)
key <- as.raw(sample(1:32,32))
write.aes(data,"encrypted.dat",key)
result <- read.aes("encrypted.dat",key)  
# did it work?
all.equal(data,result)
# [1] TRUE

这使用ECB模式AES加密。显然,您需要使用相同的密钥来加密和解密。 write.aes(...)将数据帧转换为csv格式的文本字符串,将其转换为raw(AES需要),将原始向量填充到16个字节的倍数(AES也需要),加密和写入二进制文件。 read.aes(...)基本上颠倒了这个过程。

这只是一个例子,旨在根据您的需要进行修改。例如,这会保存没有行名的数据框,这可能是也可能不是问题。