我有一个文本数据集,我想循环查看是否有特定的电子邮件域。
sample_emails = c("xyz@harvard.edu","xyz@gmail.com","zyx@harvard.edu")
sample_match = unlist(regmatches(sample_emails, gregexpr("^[A-Z0-9._%+-]+@harvard.edu$",sample_emails)))
我希望获得的是一个包含" xyz@harvard.edu"的列表。和" zyx@harvard.edu"。
相反,我明白了:
> sample_match
character(0)
我做错了什么?
答案 0 :(得分:-1)
试试这个:
sample_emails[grep('.*\\.edu',sample_emails)]
[1] "xyz@harvard.edu" "zyx@harvard.edu"