Question

我有这种格式的文件

81535883v2a1.hbrxly.com,a,209.99.40.222
81535883v2a1.hbrxly.com,ns,dns10.parkpage.foundationapi.co
81535883v2a1.hbrxly.com,txt,|v=spf1 a -all
81535883v2a1.nsmodel.com,a,23.245.38.79
81535883v2a1.panbao.net,cname,p.dcoin.co
81535883v2a1.sznissei.com,a,23.224.47.73
81535883v2a1.tauri.com.cn,a,23.244.110.119
81535883v2a1.vemega.net,a,103.232.215.133

我想把它提取成这样的东西（仅限第一行和域）

hbrxly.com
hbrxly.com
hbrxly.com
nsmodel.com
panbao.net
sznissei.com
tauri.com
vemega.net

我尝试过使用sed，awk，grep但仍然无法正常工作。我不知道，希望有人可以提供帮助。

Answer 1

awk -F'[.,]' '{print $2,$3}' OFS="." file

hbrxly.com
hbrxly.com
hbrxly.com
nsmodel.com
panbao.net
sznissei.com
tauri.com
vemega.net

Answer 2

$ grep -oP '^[^.]+\.\K[^.]+\.[^.,]+' ip.txt 
hbrxly.com
hbrxly.com
hbrxly.com
nsmodel.com
panbao.net
sznissei.com
tauri.com
vemega.net

如果您需要字符串到,

$ grep -oP '^[^.]+\.\K[^,]+' ip.txt 
hbrxly.com
hbrxly.com
hbrxly.com
nsmodel.com
panbao.net
sznissei.com
tauri.com.cn
vemega.net

Answer 3

awk -F, '{sub(/^[^.]*\./,"",$1)} {print $1}' infile
hbrxly.com
hbrxly.com
hbrxly.com
nsmodel.com
panbao.net
sznissei.com
tauri.com.cn
vemega.net

For unique domain names.

awk -F, '{sub(/^[^.]*\./,"",$1)} {print $1}' infile |sort -u

Or as sp asic suggested

awk -F, '{sub(/^[^.]*\./,"",$1)} !seen[$1]++{print $1}'  infile

Answer 4

$ sed 's/[^.]*\.\([^,]*\).*/\1/' file
hbrxly.com
hbrxly.com
hbrxly.com
nsmodel.com
panbao.net
sznissei.com
tauri.com.cn
vemega.net

Answer 5

使用Perl：

perl -ne ' use strict; use warnings; $_ =~ m/(.*?)\.(.*?),(.*)/g; {print $2, "\n"}' file

<强>输出

hbrxly.com
hbrxly.com
hbrxly.com
nsmodel.com
panbao.net
sznissei.com
tauri.com.cn
vemega.net

Answer 6

在GNU awk中。它仅打印每个域的第一个出现，并且还使用host.subdomain.domain.tldn等地址。

$ awk -F, '(d=gensub(/^.*\.([^.]+\.[^.]+)$/,"\\1","g",$1)) && !seen[d]++ {print d}' file
hbrxly.com
nsmodel.com
panbao.net
sznissei.com
com.cn
vemega.net

如果你想要子域名（即除了主机名之外的所有东西），那么：

$ awk -F, '(d=gensub(/^[^.]+\.(.+)$/,"\\1","g",$1)) && !seen[d]++ {print d}' file
hbrxly.com
nsmodel.com
panbao.net
sznissei.com
tauri.com.cn
vemega.net

从区域文件中提取域

6 个答案:

使用Perl：