我是脚本新手,但我想学习它。 我要做的是从文本文件中删除所有出现的http:// *。我想用sed命令和正则表达式来做。
这是我到目前为止所做的:
sed 's/http:\/\/.*/ /' < input.txt > output.txt
此代码用空格替换所有超链接。但问题是它还会删除剩下的部分。
如何解决此问题?我试过添加空格,“http://.*”或单词“http://.* \&gt;”的结尾或者我在互联网上找到的其他技巧,但它们没有用。
还有更好的方法吗,而不是使用sed?
答案 0 :(得分:0)
Sed是一个很好的方法。尝试将正则表达式更改为s!http://[^[:space:]]*! !g
。