如何使用sed匹配任何URL?

时间:2014-08-06 18:41:55

标签: regex linux bash sed

我正在尝试用一个令牌替换大量文档中的所有URL,但是我正在做的正则表达式似乎不起作用

s/www\.[a-z|0-9]*[.a-z]*/urltoken/g

这将匹配www.example.com或www.example.com.co。但是如果之后还有其他字符或单词组合,例如www.foo.bar?q=lol或www.regexr.com/index.html?q=bar。在我验证网址的第一部分后,我想要适合任何字符组合,即www.example.com.co_(这里是那些字符)_,但是在遇到单个空格之前。什么样的正则表达式适合sed?

1 个答案:

答案 0 :(得分:1)

sed 's/www\.[^ ]*/urltoken/g' file