如何在R中的文本数据中搜索特定的电子邮件域?

时间:2015-08-21 20:28:19

标签: regex r email-validation

我有一个文本数据集,我想循环查看是否有特定的电子邮件域。

sample_emails = c("xyz@harvard.edu","xyz@gmail.com","zyx@harvard.edu")

sample_match = unlist(regmatches(sample_emails, gregexpr("^[A-Z0-9._%+-]+@harvard.edu$",sample_emails)))

我希望获得的是一个包含" xyz@harvard.edu"的列表。和" zyx@harvard.edu"。

相反,我明白了:

> sample_match
character(0)

我做错了什么?

1 个答案:

答案 0 :(得分:-1)

试试这个:

 sample_emails[grep('.*\\.edu',sample_emails)]
    [1] "xyz@harvard.edu" "zyx@harvard.edu"