Python将gff3格式转换为制表符分隔格式

时间:2014-08-26 01:51:54

标签: python

我正在寻求帮助在python中将gff3转换为制表符分隔格式。 gff3格式是MetaGene(ORFs鉴定)的输出

这是gff3格式

# 1  
# gc = 0.431382
# bacteria
203     352     +       0       5.71721 complete
630     860     -       0       5.47138 complete
1627    2106    +       0       6.34693 complete
2052    2579    +       0       10.1632 complete
2693    3025    +       0       3.34757 complete
3036    3338    +       0       12.6268 complete
3686    3988    +       0       9.13142 complete

# 2
# gc = 0.542127
# bacteria
1       750     +       0       54.861  partial (lack 5'-end)
764     1024    +       0       2.2746  complete
1166    1381    +       0       19.3387 complete
1459    1710    -       0       11.7264 complete
1740    2042    -       0       28.3932 complete
2138    2314    +       0       3.60539 complete

所需的输出应为

#ORF    source_DNA  start   end   strand
1.1           1      203    352     +
1.2           1      630    860     -
1.3           1      1627   2106    +
1.4           1      2052   2579    +
1.5           1      2693   3025    +
1.6           1      3036   3338    +
1.7           1      3686   3988    +
2.1           2      1      750     +
2.2           2      764    1024    +
2.3           2      1166   1381    +
2.4           2      1459   1710    -
2.5           2      1740   2042    -
2.6           2      2138   2314    +

0 个答案:

没有答案