如何从文字中删除链接?我认为我应该使用sed命令,但我不知道确切的语法。
答案 0 :(得分:0)
这将删除以.com
或.org
结尾的所有内容:
sed 's/\s\?\w\+\.\(com\|org\)//g' foo.txt
输入:
lallalalala blabla.com babababab hehehe.org.
输出:
lallalalala babababab.
编辑:这是POSIX标准。我还添加了一些字符来匹配可能存在子域或协议(http://
)
sed 's/[[:space:]]\?[A-Za-z0-9_\/\:\.-]\+\.\(com\|org\)//g' foo.txt
另请注意,这不包括域后缀(example.com/query?foo=bar
)之后引用资源的所有可能的URL字符或URL。