从列R中的不同电子邮件中提取特定电子邮件

时间:2016-12-25 00:11:47

标签: r email text-extraction

我想从我的数据框中的“收件人”列中提取特定的电子邮件(@ enron.com)。在某些行中,有多个电子邮件。例如,在一行中我有这个:co_cellvars。我的问题是如何从这个专栏中提取Enron域名(@ enron.com)的电子邮件并将其保存在新专栏中?我可以提取它们但问题是它将每封电子邮件放在一行中是不正确的,因为例如,一行包含20封电子邮件中的10封安全电子邮件我想让所有安然电子邮件连续排成10行。我从这里运行代码:How to extract expression matching an email address in a text file using R or Command Line?is_creator但是我收到此错误: mark.guzman@enron.com, creightonca@hotmail.com, brendanf@gfsloans.com, seastape@teleport.com, penn_eric@salkeiz.k12.or.us,joe.stepenovitch@enron.com, jan.king@enron.com

1 个答案:

答案 0 :(得分:1)

我们可以将grep用于此

subset(df, grepl("enron.com", To))

如果一行中有多封电子邮件,请使用str_extract

library(stringr)
data.frame(To =sapply(str_extract_all(df$To, "\\S+@enron.com"), paste, collapse=","))