对于我的工作,我需要比对100种不同细菌的完整基因组。但是这次我只是测试了其中两个。我从NCBI下载了序列,并与progressiveMauve进行了比对。然后,我尝试运行以下软件。 https://sanger-pathogens.github.io/gubbins/首先,我将文件与progressiveMauve对齐。它产生了.xmfa文件,我知道我必须以正确的fasta格式转换文件。然后,我按照https://sourceforge.net/p/mauve/mailman/message/35156599/的指示进行操作 我选择了第二个,因为第一个的链接不起作用。
使用此脚本: https://github.com/kjolley/seq_scripts/blob/master/xmfa2fasta.pl
但是错误消息是
bash-4.2 $ run_gubbins.py t.fasta 意外的错误: 输入的FASTA文件出错:格式错误,因此请检查其 对齐
每个序列的长度必须相同 您输入的fasta文件有问题,因此直到您无法执行任何操作 你修好它 bash-4.2 $ awk'/ ^> / {if(seqlen){print seqlen};打印; seqlen = 0; next; } {seqlen + = length($ 0)} END {print seqlen}'t.fasta
1 7287934 2 7287685
因此,长度不一样。我该如何解决这个问题?而且有人可以提供给我其他脚本将xmfa转换为fasta吗?