Question

我有一个文本文件，其中每个行至少有两列。第一列是唯一ID，后面的每一列是fasta序列（DNA序列标识符）的标识符。我的问题是如何将这个结构重塑为两列矩阵。

这意味着我想要使用这种数据格式：

1040713 91
969805  47
862949  502 485
798097  671 593
939058  575
721526  400 523 76  610

采用以下数据格式：

1040713 91
969805  47
862949  502 
862949  485
798097  671 
798097  593
939058  575
721526  400
721526  523
721526  76
721526  610

我正在尝试使用awk -F＆＃39; \ t＆＃39; ＆＃39; {print $ 3}＆＃39; |到一个带有换行符和第一列的sed。但是，我不确定如何访问管道后的第一列。任何建议，以实现我想要的格式将不胜感激。

Answer 1

awk救援！

awk '{for(i=2;i<=NF;i++) print $1 "\t" $i}'