我有一个gff3文件,该文件具有完整的长度顺序。但是,几乎没有完整的序列具有多个UTR。我希望将它们过滤掉。有可用的工具吗?
scaffold105size588288 transdecoder gene 130390 132407 . + .
scaffold105size588288 transdecoder mRNA 130390 132407 . + .
scaffold105size588288 transdecoder five_prime_UTR 130390 130818 . + .
scaffold105size588288 transdecoder exon 130390 132407 . + .
scaffold105size588288 transdecoder CDS 130819 131979 . + 0
scaffold105size588288 transdecoder three_prime_UTR 131980 132407 . + .
scaffold105size588288 transdecoder gene 278652 281390 . + .
scaffold105size588288 transdecoder mRNA 278652 281390 . + .
scaffold105size588288 transdecoder five_prime_UTR 278652 278776 . + .
scaffold105size588288 transdecoder exon 278652 278847 . + .
scaffold105size588288 transdecoder CDS 278777 278847 . + 0
scaffold105size588288 transdecoder exon 279283 280020 . + .
scaffold105size588288 transdecoder CDS 279283 279589 . + 1
scaffold105size588288 transdecoder exon 280311 280393 . + .
scaffold105size588288 transdecoder three_prime_UTR 280311 280393 . + .
scaffold105size588288 transdecoder three_prime_UTR 280593 280678 . + .
scaffold105size588288 transdecoder three_prime_UTR 280757 280812 . + .
在这个修剪的示例中,我需要删除第二个基因集,因为它具有3个3'UTR,并保留了第一个基因,这是一个完整的集。
谢谢。