删除一定长度的网址

时间:2016-07-12 20:35:01

标签: bash perl awk sed

我有一个平面文件,其中包含我想要蜘蛛的URL列表。我只想检查一定长度的那些。我不知道有任何方法可以通过bash从列表中删除较短的URL。是否可以创建一个简单的do循环来删除文件中包含少于5个前向斜线的行? “/”

2 个答案:

答案 0 :(得分:0)

您可以简单地:

grep '://.*/.*/.*/.*/.*/' urls.txt

这只会匹配至少有5个斜杠的行。

答案 1 :(得分:0)

使用

grep '//.*/.*/.*/' filename