Question

我想使用awk合并左侧数据时文件的右侧。

输入文件：

cazd0002221|1
cazd0002221|2
ceed0008792|2
croty000287|3
cazd0002221|3
crory000287|3
ceed0008792|1
ceed0008792|2

预期输出为：

cazd0002221|1,2,3
ceed0008792|2,1
croty000287|3
crory000287|3

Answer 1

awk -F"|" '{a[$1]=a[$1]","$2;next}END{for(i in a)print i"|"substr(a[i],2)}' your_file

测试如下：

> cat temp
cazd0002221|1
cazd0002221|2
ceed0008792|2
croty000287|3
cazd0002221|3
crory000287|3
ceed0008792|1
ceed0008792|2
> awk -F"|" '{a[$1]=a[$1]","$2;next}END{for(i in a)print i"|"substr(a[i],2)}' temp
cazd0002221|1,2,3
ceed0008792|2,1,2
crory000287|3
croty000287|3

您的输入ceed0008792|2中有重复的行。这就是为什么输出具有此行ceed0008792|2,1,2的原因如果你想消除那个重复的行，那么按以下步骤操作：

> sort -u temp | awk -F"|" '{a[$1]=a[$1]","$2;next}END{for(i in a)print i"|"substr(a[i],2)}'
cazd0002221|1,2,3
ceed0008792|1,2
crory000287|3
croty000287|3

Answer 2

这可能适合你（sort＆amp; GNU sed）;

sort file | sed ':a;$!N;s/^\(\([^|]*|\).*\)\n\2/\1,/;ta;P;D'

如何使用awk合并右侧数据时左侧是常见的

2 个答案: