如何将电子邮件regex
模式替换为丢失。我试过了
blogs.smpl <- "mami@yahoo.com : subject:Lorem Ipsum body: is simply dummy text of the printing and typesetting industry.Lorem@Ipsum.com has been the industry's standard dummy text ever since the 1500s"
blogs.smpl1 <- gsub("^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\\.[a-zA-Z0-9.-]+$","",blogs.smpl )
blogs.smpl1
但不替换电子邮件地址。我也尝试过使用这种模式
email2 <- "^[[:alnum:].-]+@[[:alnum:].-]+$"
答案 0 :(得分:0)
整个模式周围的anchors是问题所在。 ^
锚点断言正则表达式引擎在字符串中的当前位置是字符串的开头,$
断言字符串末尾的位置。这些地址不在您的字符串中的任何位置。因此,通过实现两个锚点,您告诉引擎您的整个字符串应与此模式匹配。
您可以简单地删除两个锚点,它将替换数据中的地址。或者,如果你知道这些地址总是以空格为界,那就足够了。
gsub('\\S+@\\S+', '', blogs.smpl)