我正在尝试创建一个用令牌替换URL的正则表达式。这就是我得到了多远,我不明白为什么这个表达式替换了URL之后的所有内容,除了最后一个单词。
string<-"This is a website http://www.bla.com that I like very much"
gsub("https?://.*\\s|www.*\\s"," [url] ",string)
>>"this is a website [url] much"
非常感谢你的帮助!
答案 0 :(得分:0)
问题是.*
- 它会贪婪地匹配任何,因此您将一直匹配 last 空间。尝试
而是gsub("https?://[^[:blank:]]*","[url]",string)
。