我有一个带有电子邮件ID的文本文件,我正在阅读R(例1)。有时该字段为空白(示例2)。
example 1: To: admin@naukrioverseas.com
example 2: To:
我使用以下代码来读取数据:
to <- grep(a, pattern = "To:.*", value = T)
to <- unlist(regmatches(to, gregexpr("([_a-z0-9-]+(\\.[_a-z0-9-]+)*@[a-z0-9-]+(\\.[a-z0-9-]+)*(\\.[a-z]{2,4}))", to)))
我有类似的其他字段,例如From,Subject等。一旦我提取了值,我就将它们转换为数据框。
dat <- data.frame(from, to, date, subj)
每当我有一个没有值的文件(例2)时,得到一个长度为0的空字符,在使用它们创建数据帧时会抛出错误。每当我得到一个空字符时,有没有办法可以强制像“NoID”这样的虚拟值。我尝试了以下但似乎没有改变任何东西。
to <- if(all(nchar(to) == 0)){
to == "No mail add"
} else {
to
}
或者这个:
date <- if(is.null(date)){
date == 0
} else {
date
}
我可以强制一个值或NA,以便我可以解析每个邮件ID吗?