Question

我有一个文件，其中包含行中的多个变量和列中这些变量的值。有些行是重复的，只包含某些列的数据（例如下面的示例，第二次＆＃34; A＆＃34;出现，它只包含S1和S2列中的数据）

示例：

Variable S1 S2 S3
A        3  5  6
B        4  5  6
A        some_string another_string
C        2  5  6

我想要的是添加另一个（或几个）包含重复行数据的列

输出示例：

Variable S1 S2 S3 new_column1 new_column2
A        3  5  6  some_string another_string
B        4  5  6
C        2  5  6

我在想像下面的代码可以让我在那里，但它仍然是错误的，我不确定是否甚至可以用bash做？我的代码只能创建一个新列，而且我不知道如何将数据添加到新列。我在另一个类似的问题中找到了那些代码，但不是我想要的，所以我将不胜感激！

awk 'NR==1{$5="new_column";print;next} seen[$1]++ {$5=$2}' file