Gawk打印每列的最大值

时间:2011-12-09 02:58:35

标签: linux awk gawk

我正在编写一个awk脚本,它在文本文件中输入一些输入列并打印出每列中的最大值

输入:

 $cat numbers
    10      20      30.3    40.5
    20      30      45.7    66.1
    40      75      107.2   55.6
    50      20      30.3    40.5
    60      30      45.O    66.1
    70      1134.7  50      70
    80      75      107.2   55.6

输出:

80  1134.7  107.2       70

脚本:

BEGIN {
val=0;
line=1;
}
{
if( $2 > $3 )
{
   if( $2 > val )
   {
      val=$2;
      line=$0;
   }
}
else
{
   if( $3 > val )
   {
      val=$3;
      line=$0;
   }
}
}
END{
print line
}

当前输出:

 60 30  45.O    66.1

我首先在awk脚本中做错了什么

======= SOLUTION ==

 END {
  for (i = 0; ++i <= NF;)
   printf "%s", (m[i] (i < NF ? FS : RS))
   }
 {
 for (i = 0; ++i <= NF;)
   $i > m[i] && m[i] = $i
 }

感谢您的帮助

3 个答案:

答案 0 :(得分:1)

由于您有四列,因此您至少需要四个变量,每列一个变量(如果您愿意,还需要一个数组)。而且你不需要完整地保留任何一条线。独立处理每一列。

答案 1 :(得分:1)

您需要根据您的目的调整以下内容,以便在特定列中找到最大值(在本例中为第二列)。

awk 'BEGIN {max = 0} {if ($2>max) max=$2} END {print max}' numbers.dat

您使用2美元的方法&gt; $ 3似乎是将两列相互比较。

答案 2 :(得分:0)

您可以创建一个用户定义的函数,然后将单个列数组传递给它以检索最大值。像这样的东西 -

[jaypal:~/Temp] cat numbers
10 20 30.3 40.5
20 30 45.7 66.1
40 75 107.2 55.6
50 20 30.3 40.5
60 30 45.O 66.1
70 1134.7 50.0 70
80 75 107.2 55.6

[jaypal:~/Temp] awk '             
function max(x){i=0;for(val in x){if(i<=x[val]){i=x[val];}}return i;} 
{a[$1]=$1;b[$2]=$2;c[$3]=$3;d[$4]=$4;next} 
END{col1=max(a);col2=max(b);col3=max(c);col4=max(d);print col1,col2,col3,col4}' numbers
80 1134.7 107.2 70

awk 'a<$1{a=$1}b<$2{b=$2}c<$3{c=$3}d<$4{d=$4} END{print a,b,c,d}' numbers