2个文件,相同的第一列,一个文件包含大量不同数据的重复

时间:2015-09-17 01:59:30

标签: sorting unix join sed

File1中:

000333999:dat:data:dataa
999333000:da:daa:daata
939494092:data:data:dataa

这样的行

文件2:

000333999:999303
000333999:3243257224
000333999:23552
939494092:921942
000333999:243252
939494092::3243257224
939494092:243252
939494092:332432
000333999:332432
000333999:353252
939494092:299
000333999:342342351142
939494092:392
000333999:3253251
000333999:532322
000333999:2324325

我希望所有行在这样的文件中匹配:

000333999:dat:data:dataa:999303:2324325:532322:3253251:342342351142:353252:332432  

感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

awk -F ':' '{sub( /^[^:]*/, "",V=$0);Anchor[$1]=Anchor[$1] V} END{ for( Data in Anchor) print Data Anchor[Data]}' File1 File2

线路输出顺序可能不同