过滤gff3文件以获取完整基因

时间:2019-04-21 08:21:54

标签: genome gff

我有一个gff3文件,该文件具有完整的长度顺序。但是,几乎没有完整的序列具有多个UTR。我希望将它们过滤掉。有可用的工具吗?

scaffold105size588288 transdecoder gene 130390 132407 . + . 
scaffold105size588288 transdecoder mRNA 130390 132407 . + . 
scaffold105size588288 transdecoder five_prime_UTR 130390 130818 . + . 
scaffold105size588288 transdecoder exon 130390 132407 . + . 
scaffold105size588288 transdecoder CDS 130819 131979 . + 0 
scaffold105size588288 transdecoder three_prime_UTR 131980 132407 . + .

scaffold105size588288 transdecoder gene 278652 281390 . + . 
scaffold105size588288 transdecoder mRNA 278652 281390 . + . 
scaffold105size588288 transdecoder five_prime_UTR 278652 278776 . + . 
scaffold105size588288 transdecoder exon 278652 278847 . + . 
scaffold105size588288 transdecoder CDS 278777 278847 . + 0 
scaffold105size588288 transdecoder exon 279283 280020 . + . 
scaffold105size588288 transdecoder CDS 279283 279589 . + 1 
scaffold105size588288 transdecoder exon 280311 280393 . + . 
scaffold105size588288 transdecoder three_prime_UTR 280311 280393 . + . 
scaffold105size588288 transdecoder three_prime_UTR 280593 280678 . + .
scaffold105size588288 transdecoder three_prime_UTR 280757 280812 . + .

在这个修剪的示例中,我需要删除第二个基因集,因为它具有3个3'UTR,并保留了第一个基因,这是一个完整的集。

谢谢。

0 个答案:

没有答案