我正在网上上课以熟悉R.我在完成其中一个练习时遇到了一些困难/困惑。
emails <- c("john.doe@ivyleague.edu", "education@world.gov", "dalai.lama@peace.org", "invalid.edu", "quant@bigdatacollege.edu", "cookie.monster@sesame.tv")
**hits <- grep(pattern = "@.*\\.edu$", x = emails)**
任何人都可以分解(解释)代码中的部分,这是引用(&#34; @。* \ .edu $&#34;)?特别是,我不明白反弹的目的?经过一些研究,据我所知,&#34; \&#34;是一个逃脱角色。但是,我不明白它在上述(粗体)代码中使用的目的是什么。在此先感谢。
答案 0 :(得分:1)
这是一个正则表达式,旨在匹配电子邮件地址的一些特定元素。当你在正则表达式中转义某些东西时,这是因为你想要匹配的保留字符,但没有一点格式就无法使用。一些常见的保留字符是。* [(])
所以在你的表达中,这是对正在发生的事情的细分。
@ matches the character '@' literally
.* matches any character (except newline)
\. matches the character '.' literally
edu matches the characters 'edu' literally (case sensitive)
$ asserts position at end of the string
您可以使用在线提供的众多正则表达式测试仪之一来更多地尝试这些内容。 Here's一个好的