我有一个URL列表,其中一些在域名后面有路径,而有些则没有。 我需要提取域名之后没有任何URL的所有URL。
输入:
https://youtube.com/user/
https://google.com/
https://twitter.com/home/
https://facebook.com/
输出:
https://google.com/
https://facebook.com/
否则,在第三个斜杠出现后如何删除所有内容?
答案 0 :(得分:0)
grep可以帮助您:
grep -v '[^/]/[^/]' file
要执行删除操作,sed
可以提供帮助:
sed 's#\([^/]\)/[^/].*#\1/#' file
如何删除斜线超过3条的所有行?
awk '{a=$0}gsub(/\//,"",a)<=3' file