使用awk根据列值计算不同的和

时间:2019-01-09 07:55:35

标签: shell if-statement awk

我有一个包含5列的文件:

1   1311    2   171115067   1.1688e-08
1   1313    3   171115067   1.75321e-08
1   1314    4   171115067   2.33761e-08
2   1679    5   135534747   3.68909e-08
2   1680    2   135534747   1.47564e-08
3   688 34  191154276   1.77867e-07
3   689 38  191154276   1.98792e-07
3   690 39  191154276   2.04024e-07

我想获得字段$2*$3/$4中给定的每个索引的累积值$1

因此,例如:对于索引1,我应该有(1311*2+1313*3+1314*4)/171115067,对于2中的索引$1,它应该读为(1679*5+1680*2)/135534747 < / p>

我尝试过的是:

awk '{sum+=($2*$3)/$4} END { print "Result = ",sum}'

但这给了我所有乘积的总和除以每次,这不是我所需要的

3 个答案:

答案 0 :(得分:1)

编辑: 根据OP的注释也添加了模糊解决方案,这也将给出所有第1列的总和。

awk '
prev!=$1 && prev{
  if(fourth){
    printf("%.9f\n",mul/fourth)
    sum+=sprintf("%.9f\n",mul/fourth)
  }
  else{
    print 0
  }
  mul=fourth=prev=""
}
{
  mul+=$2*$3
  fourth=$4
  prev=$1
  total_sum[$1]+=($2*$3)
}
END{
  if(prev){
    if(fourth){
       printf("%.9f\n",mul/fourth)
       sum+=sprintf("%.9f\n",mul/fourth)
    }
    else{
       print 0
    }
  }
  print "total= ",sum
}'  Input_file


请您尝试以下。

awk '
prev!=$1 && prev{
  if(fourth){
    printf("%.9f\n",mul/fourth)
  }
  else{
    print 0
  }
  mul=fourth=prev=""
}
{
  mul+=$2*$3
  fourth=$4
  prev=$1
}
END{
  if(prev){
    if(fourth){
      printf("%.9f\n",mul/fourth)
    }
    else{
      print 0
    }
  }
}'  Input_file

答案 1 :(得分:0)

如果您的数据已排序,则可以执行以下操作:

awk '(NR==1) { num=0; den=$4; tmp=$1 }
     ($1!=tmp) { print "Result",tmp,":",num/den;
                 num=0; den=$4; tmp=$1 }
     { num+= $2*$3 }
     END { print "Result",tmp,":",num/den }' file

如果您的数据未排序,则可以执行以下操作:

awk '{ sum[$1]+= $2*$3/$4 }
     END { for(i in sum) { print "Result",i,":",sum[i] }' file

并输出:

Result 1 : 6.90588e-05
Result 2 : 8.67305e-05
Result 3 : 0.000400117

答案 2 :(得分:0)

使用Perl

$ cat sara.txt
1   1311    2   171115067   1.1688e-08
1   1313    3   171115067   1.75321e-08
1   1314    4   171115067   2.33761e-08
2   1679    5   135534747   3.68909e-08
2   1680    2   135534747   1.47564e-08
3   688 34  191154276   1.77867e-07
3   689 38  191154276   1.98792e-07
3   690 39  191154276   2.04024e-07
$ perl -lane ' $kv{join(",",$F[0],$F[3])}+=$F[1]*$F[2]; END { for(sort keys %kv) { @x=split(",");print "$x[0],",$kv{$_}/$x[1]} print eval(join("+",values %kv)) } ' sara.txt
1,6.90587930518123e-05
2,8.67305267482441e-05
3,0.000400116605291111
100056
$