如何使用`awk`来grep某些像这样的列?

时间:2014-07-07 14:30:38

标签: bash awk

所以基本上我有一些这样的文字:

[ 4] .init             PROGBITS        080481c0 0001c0 00002e 00  AX  0   0  4
[ 5] .plt              PROGBITS        080481f0 0001f0 000110 00  AX  0   0 16
[ 6] .text             PROGBITS        08048300 000300 07c95c 00  AX  0   0 16
[ 7] __libc_thread_fre PROGBITS        080c4c60 07cc60 000076 00  AX  0   0 16
[ 8] __libc_freeres_fn PROGBITS        080c4ce0 07cce0 000b2f 00  AX  0   0 16
[ 9] .fini             PROGBITS        080c5810 07d810 00001a 00  AX  0   0  4
[10] .rodata           PROGBITS        080c5840 07d840 019774 00   A  0   0 32
[11] __libc_thread_sub PROGBITS        080defb4 096fb4 000004 00   A  0   0  4
[12] __libc_subfreeres PROGBITS        080defb8 096fb8 00002c 00   A  0   0  4
[13] __libc_atexit     PROGBITS        080defe4 096fe4 000004 00   A  0   0  4

我想要得到的是:

.init                    080481c0 0001c0 00002e 
.plt                     080481f0 0001f0 000110 
.text                    08048300 000300 07c95c 
__libc_thread_fre        080c4c60 07cc60 000076 
__libc_freeres_fn        080c4ce0 07cce0 000b2f  
.fini                    080c5810 07d810 00001a 
.rodata                  080c5840 07d840 019774 
__libc_thread_sub        080defb4 096fb4 000004 
__libc_subfreeres        080defb8 096fb8 00002c  
__libc_atexit            080defe4 096fe4 000004 

我试过这样的事情:

 awk '/PROGBITS/ {print $2,$4,$5,$6} '

但问题是,[ 4] ..中有一个空格,这意味着4-9行,我必须使用

awk '/PROGBITS/ {print $3,$5,$6,$7} '

在获取我想要的所有列时,是否仍然使用单个命令..?

8 个答案:

答案 0 :(得分:3)

您也可以尝试:

awk '/PROGBITS/{print $(NF-9),$(NF-7),$(NF-6),$(NF-5)}' file

如果你想通过选择宽度列来保持可读性:

awk '/PROGBITS/{printf "%-18s %-10s %-10s %-10s\n", $(NF-9),$(NF-7),$(NF-6),$(NF-5)}' file

您的文件也不是不可能将\t(制表符)作为字段分隔符;如果是这样,你可以尝试:

awk -F"\t" '{print $2,$4,$5,$6}' file

希望这有帮助。

答案 1 :(得分:3)

使用gnu awk,您可以使用这种优雅的方式处理字段固定宽度的文本。它还将保留格式。

awk -v FIELDWIDTHS="5 18 16 8 7 8" '{print $2,$4,$5,$6}' file
.init              080481c0  0001c0  00002e
.plt               080481f0  0001f0  000110
.text              08048300  000300  07c95c
__libc_thread_fre  080c4c60  07cc60  000076
__libc_freeres_fn  080c4ce0  07cce0  000b2f
.fini              080c5810  07d810  00001a
.rodata            080c5840  07d840  019774
__libc_thread_sub  080defb4  096fb4  000004
__libc_subfreeres  080defb8  096fb8  00002c
__libc_atexit      080defe4  096fe4  000004

答案 2 :(得分:3)

如果您只需按指定提取列 cut即可

cut -c 6-22 -c 32-62 file

答案 3 :(得分:2)

如果您可以使用perl

perl -lne '/\] \K(.*)PROGBITS\s+(\w+)\s+(\w+)\s+(\w+)/ && print "$1 $2 $3 $4" '

行动中:

perl -lne '/\] \K(.*)PROGBITS\s+(\w+)\s+(\w+)\s+(\w+)/ && print "$1 $2 $3 $4" ' file
.init              080481c0 0001c0 00002e
.plt               080481f0 0001f0 000110
.text              08048300 000300 07c95c
__libc_thread_fre  080c4c60 07cc60 000076
__libc_freeres_fn  080c4ce0 07cce0 000b2f
.fini              080c5810 07d810 00001a
.rodata            080c5840 07d840 019774
__libc_thread_sub  080defb4 096fb4 000004
__libc_subfreeres  080defb8 096fb8 00002c
__libc_atexit      080defe4 096fe4 000004

答案 4 :(得分:2)

您可以使用-F添加字段分隔符选项:

awk -F'^\\[ *[0-9]+\\] | +' '{printf "%-24s %-8s %-6s %-6s\n", $2, $4, $5, $6}' file

作为字段分隔符传递的正则表达式负责在每行的开头处出现数值/空间歧义的可能性。

答案 5 :(得分:1)

您可以在[

之后立即删除任何空格
sed 's_\[\s_[_'

尝试,

echo '[ 1]' | sed 's_\[\s_[_'

它会打印[1]

答案 6 :(得分:1)

sed解决方案(GNU sed和FreeBSD / OS X sed) - 提示@Tiago's helpful Perl solution

sed -E 's/^.*\] (.*)PROGBITS( +[^ ]+)( +[^ ]+)( +[^ ]+).*$/\1 \2 \3 \4/' file
  • 使用与整个行匹配的正则表达式,其中捕获组((...))与感兴趣的数据(包括前面的空格)匹配,然后仅使用数据替换该行有趣的是 - \1指的是第一个捕获组的匹配,\2指的是第二个,...

请注意可以以符合POSIX标准的方式完成,但它会变得丑陋:

sed 's/^.*\] \(.*\)PROGBITS\( \{1,\}[^ ]\{1,\}\)\( \{1,\}[^ ]\{1,\}\)\( \{1,\}[^ ]\{1,\}\).*$/\1 \2 \3 \4/' file

答案 7 :(得分:0)

试试这个:

awk '/PROGBITS/ {if (NF==12) print $3,$5,$6,$7; else print $2,$4,$5,$6}'