我有一个文件,其中包含行中的多个变量和列中这些变量的值。有些行是重复的,只包含某些列的数据(例如下面的示例,第二次" A"出现,它只包含S1和S2列中的数据)
示例:
Variable S1 S2 S3
A 3 5 6
B 4 5 6
A some_string another_string
C 2 5 6
我想要的是添加另一个(或几个)包含重复行数据的列
输出示例:
Variable S1 S2 S3 new_column1 new_column2
A 3 5 6 some_string another_string
B 4 5 6
C 2 5 6
我在想像下面的代码可以让我在那里,但它仍然是错误的,我不确定是否甚至可以用bash做? 我的代码只能创建一个新列,而且我不知道如何将数据添加到新列。 我在另一个类似的问题中找到了那些代码,但不是我想要的,所以我将不胜感激!
awk 'NR==1{$5="new_column";print;next} seen[$1]++ {$5=$2}' file