我有一个敏感的数据集,永远不应该以未加密的方式存储在磁盘上。 R可以处理这个或者是全盘加密我唯一的选择吗?
答案 0 :(得分:13)
我觉得有一种更简单的方法可以做到这一点,但digest
包进行AES加密,是我遇到的最接近你要求的东西。这应该可以帮到你。
# write encrypted data frame to file
write.aes <- function(df,filename, key) {
require(digest)
zz <- textConnection("out","w")
write.csv(df,zz, row.names=F)
close(zz)
out <- paste(out,collapse="\n")
raw <- charToRaw(out)
raw <- c(raw,as.raw(rep(0,16-length(raw)%%16)))
aes <- AES(key,mode="ECB")
aes$encrypt(raw)
writeBin(aes$encrypt(raw),filename)
}
# read encypted data frame from file
read.aes <- function(filename,key) {
require(digest)
dat <- readBin(filename,"raw",n=1000)
aes <- AES(key,mode="ECB")
raw <- aes$decrypt(dat, raw=TRUE)
txt <- rawToChar(raw[raw>0])
read.csv(text=txt)
}
# sample data
set.seed(1) # for reproducible example
data <- data.frame(x=rnorm(10),y=rpois(10,1),
z=letters[1:10],w=sample(T:F,10,replace=T))
set.seed(123581321)
key <- as.raw(sample(1:32,32))
write.aes(data,"encrypted.dat",key)
result <- read.aes("encrypted.dat",key)
# did it work?
all.equal(data,result)
# [1] TRUE
这使用ECB模式AES加密。显然,您需要使用相同的密钥来加密和解密。 write.aes(...)
将数据帧转换为csv格式的文本字符串,将其转换为raw(AES需要),将原始向量填充到16个字节的倍数(AES也需要),加密和写入二进制文件。 read.aes(...)
基本上颠倒了这个过程。
这只是一个例子,旨在根据您的需要进行修改。例如,这会保存没有行名的数据框,这可能是也可能不是问题。