从文本中删除链接

时间:2010-11-24 13:10:06

标签: text sed

如何从文字中删除链接?我认为我应该使用sed命令,但我不知道确切的语法。

1 个答案:

答案 0 :(得分:0)

这将删除以.com.org结尾的所有内容:

sed 's/\s\?\w\+\.\(com\|org\)//g' foo.txt

输入:

lallalalala blabla.com babababab hehehe.org. 

输出:

lallalalala babababab.

编辑:这是POSIX标准。我还添加了一些字符来匹配可能存在子域或协议(http://

的情况
sed 's/[[:space:]]\?[A-Za-z0-9_\/\:\.-]\+\.\(com\|org\)//g' foo.txt 

另请注意,这不包括域后缀(example.com/query?foo=bar)之后引用资源的所有可能的URL字符或URL。