将R中的电子邮件地址的本地部分哈希化以混淆值

时间:2018-12-07 16:33:31

标签: r hash

我正在尝试将电子邮件地址字段解析为本地和域部分,MD5对本地部分进行哈希处理,然后将它们重新连接在一起。这里的目标是混淆我们开发环境中的数据,但仍然允许该字段将该字段与其他数据集合并。我有这种工作方式,但是我无法使parselcl值正确返回...我期望它是一个向量,但是它以单个值形式返回。

这是我的代码:

 library(stringr)
 localp <- gsub("@.*", "", dat$channels.email.address)
 domainp <- gsub(".*@", "", dat$channels.email.address)
 parsedlcl <- digest(localp, "md5", serialize = FALSE)
 dat$channels.email.address <- str_c(parsedlcl, "@", domainp)

1 个答案:

答案 0 :(得分:0)

您需要将digest循环到dat $ channels.email.address中的所有值上。否则,它只会在您遇到问题时生成一个值。

您的代码如下:

library(stringr)
library(digest)

localp <- gsub("@.*", "", dat$channels.email.address)
domainp <- gsub(".*@", "", dat$channels.email.address)

for(i in seq_along(dat$channels.email.address)) {
  parsedlcl[i] <- digest(localp[i], "md5", serialize = F)
}

dat$channels.email.address <- str_c(parsedlcl, "@", domainp)