解挖掘输出导出csv

时间:2014-08-04 11:24:47

标签: parsing csv awk sed dig

在shell脚本中使用dig命令并希望输出到csv格式标志和权限部分

dig @ns1.hosangit.com djzah.com +noall +authority +comments

输出

; <<>> DiG 9.8.3-P1 <<>> @ns1.hosangit.com djzah.com +noall +authority +comments
; (1 server found)
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 64505
;; flags: qr aa rd; QUERY: 1, ANSWER: 1, AUTHORITY: 3, ADDITIONAL: 0
;; WARNING: recursion requested but not available

;; AUTHORITY SECTION:
djzah.com.  3600    IN  NS  ns3.eventguyz.com.
djzah.com.  3600    IN  NS  ns1.eventguyz.com.
djzah.com.  3600    IN  NS  ns2.eventguyz.com.

csv的预期输出为(domainflags(并非总是这三个),authority section(可能为5)):

djzah.com,qr,aa,rd,ns3.eventguyz.com,ns1.eventguyz.com,ns2.eventguyz.com

我试图使用awk和/或sed但是我在搜索标记部分的模式时遇到了困难 的 ;; flags:(然后使用空格分隔符,直到到达;

然后是管理局部分,我假设你会搜索 的 ;;权威部分: 然后创建一个数组,只使用最后一个。

我不知道自己在做什么。

1 个答案:

答案 0 :(得分:1)

#!/usr/bin/awk -f
BEGIN { OFS = "," }
/^;; flags:/ {
    sub(/;; flags: /, "")
    sub(/;.*$/, "")
    $1 = $1
    flags = "," $0
    next
}
/^;/ || NF < 5 { next }
!($1 in a) {
    keys[++k] = $1
}
{
    t = $5
    sub(/[.][ \t\r]*$/, "", t)
    a[$1] = a[$1] "," t
}
END {
    for (i = 1; i <= k; ++i) {
        key = keys[k]
        t = key
        sub(/[.][ \t\r]*$/, "", t)
        print t flags a[key]
    }
}

用法:

dig @ns1.hosangit.com djzah.com +noall +authority +comments | awk -f script.awk

测试:

awk -f script.awk sample

输出:

djzah.com,qr,aa,rd,ns3.eventguyz.com,ns1.eventguyz.com,ns2.eventguyz
  • BEGIN { OFS = "," }:每次处理记录时,awk中的每个部分都会运行。 BEGIN块仅在启动时运行一次。这基本上将OFS设置为,
  • /^;; flags:/匹配;; flags:。它呈现的部分基本上从记录(行)中提取标志。 sub命令基本上从记录中删除了不必要的部分。 $1 = $1只需确保使用OFS更新$ 0。 flags = "," $0将现在以逗号分隔的标记分配到flags变量中。 next让awk跳转到下一条记录。
  • /^;/ || NF < 5 { next }基本上会让awk跳过不必要的行。
  • !($1 in a) { keys[++k] = $1 },如果$ 1,例如首先遇到djzah.com.,添加到keys数组。
  • { t = $5; sub(/[.][ \t\r]*$/, "", t); a[$1] = a[$1] "," t }添加第5列的值,例如ns3.eventguyz.com到已移除前导.的集合。
  • 处理完成后,执行END块。它遍历找到的键并打印绑定到它的数据。