删除文本文件中的所有超链接,linux脚本

时间:2013-10-31 17:35:47

标签: regex linux sed

我是脚本新手,但我想学习它。 我要做的是从文本文件中删除所有出现的http:// *。我想用sed命令和正则表达式来做。

这是我到目前为止所做的:

sed 's/http:\/\/.*/ /' < input.txt > output.txt

此代码用空格替换所有超链接。但问题是它还会删除剩下的部分。

如何解决此问题?我试过添加空格,“http://.*”或单词“http://.* \&gt;”的结尾或者我在互联网上找到的其他技巧,但它们没有用。

还有更好的方法吗,而不是使用sed?

1 个答案:

答案 0 :(得分:0)

Sed是一个很好的方法。尝试将正则表达式更改为s!http://[^[:space:]]*! !g