标签: bash perl awk sed
我有一个平面文件,其中包含我想要蜘蛛的URL列表。我只想检查一定长度的那些。我不知道有任何方法可以通过bash从列表中删除较短的URL。是否可以创建一个简单的do循环来删除文件中包含少于5个前向斜线的行? “/”
答案 0 :(得分:0)
您可以简单地:
grep '://.*/.*/.*/.*/.*/' urls.txt
这只会匹配至少有5个斜杠的行。
答案 1 :(得分:0)
使用
grep '//.*/.*/.*/' filename