我无法运行我的tophat功能

时间:2014-12-12 17:04:45

标签: python linux

我正在使用tophat命令进行一个转录组装配。 在一个文件夹中,我在GTF的同一个文件夹中有我的参考基因组,我有我的领结索引文件。 在其他文件夹中,我有两个我的转录组分割的fasta文件。我把命令tophat但看起来无法找到bowtie索引文件。我正在使用tophat 1.41,并且六个bowtie文件位于.ebwt

我正在输入下一个命令

tophat -o myfolder --mate-inner-dist 50 --mate-std-dev 20 -p 5 
/file/file1/myfolder/myfolder2/referencegenome.gtf /file/file1/myfolder/myfolder2 
/file/file1/myfolder/transcriptome_1.fastq /file/file1/myfolder/transcriptome_1.fastq

在我的folder2中,我有我的ebwt文件。我用bowtie build命令创建了它们,我从.gff中的JGI下载了我的参考基因组,后来转换为.gtf。

关于我做错了什么的任何建议? tophat命令无法找到这些文件,即使它们位于myfolder2

1 个答案:

答案 0 :(得分:0)

一些评论 1.Tophat将您的fastq读数映射到参考基因组或转录组。不是集会。

  1. 如果您有参考基因组,例如referencegenome.fa,那么您需要使用bowtie建立一个索引。在这种情况下,建议使用与基因组fasta文件相同的前缀命名该索引,即referencegenome。
  2. 然后,您将在同一目录中看到referencegenome.ebwt文件以及您的referencegenome.fa和referencegenome.gtf文件

    但是使用TopHat,您需要通过将其称为引用基因组来调用引用和索引的基因组(仅使用索引文件的前缀。不需要添加gtf,ebwt或fa结尾)。

    您是通过调用gtf文件来完成的,因此找不到索引文件。参考基因组都没有,所以TopHat无法为你建立索引

    我还建议您访问seqanwers.com和biostars.org,两个专门讨论NGS的专业论坛 格雷戈尔是对的。这与R

    无关