我正在使用tophat命令进行一个转录组装配。
在一个文件夹中,我在GTF的同一个文件夹中有我的参考基因组,我有我的领结索引文件。
在其他文件夹中,我有两个我的转录组分割的fasta文件。我把命令tophat但看起来无法找到bowtie索引文件。我正在使用tophat 1.41
,并且六个bowtie文件位于.ebwt
。
我正在输入下一个命令
tophat -o myfolder --mate-inner-dist 50 --mate-std-dev 20 -p 5
/file/file1/myfolder/myfolder2/referencegenome.gtf /file/file1/myfolder/myfolder2
/file/file1/myfolder/transcriptome_1.fastq /file/file1/myfolder/transcriptome_1.fastq
在我的folder2中,我有我的ebwt文件。我用bowtie build命令创建了它们,我从.gff中的JGI下载了我的参考基因组,后来转换为.gtf。
关于我做错了什么的任何建议?
tophat命令无法找到这些文件,即使它们位于myfolder2
。
答案 0 :(得分:0)
一些评论 1.Tophat将您的fastq读数映射到参考基因组或转录组。不是集会。
然后,您将在同一目录中看到referencegenome.ebwt文件以及您的referencegenome.fa和referencegenome.gtf文件
但是使用TopHat,您需要通过将其称为引用基因组来调用引用和索引的基因组(仅使用索引文件的前缀。不需要添加gtf,ebwt或fa结尾)。
您是通过调用gtf文件来完成的,因此找不到索引文件。参考基因组都没有,所以TopHat无法为你建立索引
我还建议您访问seqanwers.com和biostars.org,两个专门讨论NGS的专业论坛 格雷戈尔是对的。这与R
无关