简单的正则表达式替换了字符串中的应用程序

时间:2013-12-13 13:00:12

标签: regex r

我正在尝试创建一个用令牌替换URL的正则表达式。这就是我得到了多远,我不明白为什么这个表达式替换了URL之后的所有内容,除了最后一个单词。

string<-"This is a website http://www.bla.com that I like very much"
gsub("https?://.*\\s|www.*\\s"," [url] ",string)

>>"this is a website  [url] much"

非常感谢你的帮助!

1 个答案:

答案 0 :(得分:0)

问题是.* - 它会贪婪地匹配任何,因此您将一直匹配 last 空间。尝试 而是gsub("https?://[^[:blank:]]*","[url]",string)