awk来平均匹配文件中的字符串

时间:2016-05-03 19:02:54

标签: awk

我正在尝试使用$2$3中的值的总和来平均匹配的awk行。我在下面的尝试没有产生预期的结果。我做错了什么但不知道是什么。谢谢你:)。

输入

chr7:83016288-83016376 SEMA3E 70.3
chr7:83606437-83606522 SEMA3A 78.6
chr7:83640327-83640417 SEMA3A 79.2
chr8:61693548-61693999 CHD7 83.4
chr8:61714076-61714162 CHD7 86.5

期望输出 --3位小数

SEMA3A 76.0
CHD7 84.9

awk尝试1

awk '{cnt[$2]++ } {sum += $3 } END { if (NR > 0) print sum / NR }' input
79.6 -- average of all lines in input

awk尝试2

awk '{cnt+=$2; num+=$3} END{print "avg="cnt/num}' input
avg=0 -- not sure what this is calculating

1 个答案:

答案 0 :(得分:2)

$ awk '{sum[$2]+=$3; count[$2]++} 
    END{for(k in sum) printf "%s %.1f\n",  k, sum[k]/count[k]}' file

CHD7 85.0
SEMA3A 78.9
SEMA3E 70.3