我想从我的数据框中的“收件人”列中提取特定的电子邮件(@ enron.com)。在某些行中,有多个电子邮件。例如,在一行中我有这个:co_cellvars
。我的问题是如何从这个专栏中提取Enron域名(@ enron.com)的电子邮件并将其保存在新专栏中?我可以提取它们但问题是它将每封电子邮件放在一行中是不正确的,因为例如,一行包含20封电子邮件中的10封安全电子邮件我想让所有安然电子邮件连续排成10行。我从这里运行代码:How to extract expression matching an email address in a text file using R or Command Line?,is_creator
但是我收到此错误: mark.guzman@enron.com, creightonca@hotmail.com, brendanf@gfsloans.com, seastape@teleport.com, penn_eric@salkeiz.k12.or.us,joe.stepenovitch@enron.com, jan.king@enron.com
。
答案 0 :(得分:1)
我们可以将grep
用于此
subset(df, grepl("enron.com", To))
如果一行中有多封电子邮件,请使用str_extract
library(stringr)
data.frame(To =sapply(str_extract_all(df$To, "\\S+@enron.com"), paste, collapse=","))