我正在尝试使用Roary进行系统发育分析。
它说“或者你可以使用ncbi-genome-download来下载FASTA文件并用Prokka将它们转换为GFF3。”在https://sanger-pathogens.github.io/Roary/
我已经拥有了我需要的所有.fasta文件。
我应该如何将其转换为.gff3文件?
答案 0 :(得分:1)
Fasta文件包含核苷酸或肽序列(细菌/古细菌基因组中的核苷酸)。另一方面,GFF3 format中的文件包含注释,对应于基因或其他基因组特征的间隔列表。可选地,Fasta序列可以附加到GFF3文件的末尾(由##FASTA
指令分隔)。我个人认为将GFF3和Fasta合并到同一个文件中是可恶的,但显然这是某些软件包所必需的。
您提到了Roary文档中的以下摘录。
或者你可以使用ncbi-genome-download下载FASTA文件并用Prokka将它们转换为GFF3。
除非我弄错了, convert 在这里使用的是错误的词。 Prokka没有将 Fasta文件转换为GFF3文件,它将细菌/古菌基因组序列作为输入并注释它们。怎么做?你应该使用哪些参数?好吧,@ heathobrien是对的:你需要阅读prokka documentation(也许the paper)。