我正在尝试在我的计算机上本地重现我使用BLAST在他们的网站上运行mirbase的内容。 '搜索序列'选项是:我在我的计算机上下载的成熟miRNA,并使用命令将其作为BLAST数据库:
./makeblastdb -in /home/marianoavino/Downloads/mature.fa -dbtype 'nucl' -out /home/marianoavino/Downloads/mature
然后在mirbase上我看到他们使用的电子值为10,我将其留在本地。
在分析结束时的mirbase上,他们为您提供了以下参数设置:
搜索参数
搜索算法: BLASTN 序列数据库: 成熟 Evalue截止值: 10 最大比对: 100 字号: 4 比赛得分: +5 不匹配罚款: -4
这是我在计算机上用于BLAST的命令行
./blastn -db /home/marianoavino/Downloads/mature -evalue 10 -word_size 4 -query /home/marianoavino/Downloads/testinputblast.fasta -task "blastn" -out /home/marianoavino/Downloads/testBLast.out
两种分析的结果不同,mirbase发现的东西比本地BLAST要多得多。
您是否知道我应该在本地blast命令行上使用哪些参数来匹配那些列出的mirbase参数以获得相同的答案?
答案 0 :(得分:0)
可能有很多原因导致不同的结果,包括您正在使用的爆炸版本以及它们使用的版本,参数(如您所说)和数据库中的差异(请记住,数据库大小用于计算evalue之类的内容,因此你可能会得到不同的结果)。
结果的精确复制可能很困难,但问题是是否有意义?仅仅因为对齐具有一些evalue(其中10非常高)并不意味着它是有意义的。对于给定的序列,如果搜索产生不同数量的比对,但是相同数量的高质量比对(高比特核,低评价,查询和主题序列之间的完全比对),它是否重要?< / p>
我会尝试比较结果,看看这些差异在哪里,然后继续前进