我有一个文本文件,其中每个行至少有两列。第一列是唯一ID,后面的每一列是fasta序列(DNA序列标识符)的标识符。我的问题是如何将这个结构重塑为两列矩阵。
这意味着我想要使用这种数据格式:
1040713 91
969805 47
862949 502 485
798097 671 593
939058 575
721526 400 523 76 610
采用以下数据格式:
1040713 91
969805 47
862949 502
862949 485
798097 671
798097 593
939058 575
721526 400
721526 523
721526 76
721526 610
我正在尝试使用awk -F' \ t' ' {print $ 3}' |到一个带有换行符和第一列的sed。但是,我不确定如何访问管道后的第一列。任何建议,以实现我想要的格式将不胜感激。
答案 0 :(得分:1)
awk
救援!
awk '{for(i=2;i<=NF;i++) print $1 "\t" $i}'