文本文件将类似字典的行格式化为单独的行

时间:2017-11-15 01:52:28

标签: unix text awk sed formatting

我有一个文本文件,其中每个行至少有两列。第一列是唯一ID,后面的每一列是fasta序列(DNA序列标识符)的标识符。我的问题是如何将这个结构重塑为两列矩阵。

这意味着我想要使用这种数据格式:

1040713 91
969805  47
862949  502 485
798097  671 593
939058  575
721526  400 523 76  610

采用以下数据格式:

1040713 91
969805  47
862949  502 
862949  485
798097  671 
798097  593
939058  575
721526  400
721526  523
721526  76
721526  610

我正在尝试使用awk -F' \ t' ' {print $ 3}' |到一个带有换行符和第一列的sed。但是,我不确定如何访问管道后的第一列。任何建议,以实现我想要的格式将不胜感激。

1 个答案:

答案 0 :(得分:1)

awk救援!

awk '{for(i=2;i<=NF;i++) print $1 "\t" $i}'