使用GMAP映射:我应该使用哪个输出选项?

时间:2019-01-15 12:44:02

标签: assembly command

我已经使用来自被寄生虫感染的鸟的读物(通过Trinity)进行了汇编>> Trinity.fasta

我使用以下方法创建了一个基因组索引:

gmap_build -d genome -k 15 GCF_000534875.1_SCA1_genomic.fa

已创建一个名为“基因组”的目录,该目录现在位于:

ll
total 5772532
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria   12774633 Jan 15 11:28 genome.chromosome
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria   20699247 Jan 15 11:28 genome.chromosome.iit
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria          6 Jan 15 11:28 genome.chrsubset
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria   19461467 Jan 15 11:28 genome.contig
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria   21602471 Jan 15 11:28 genome.contig.iit
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria  432037584 Jan 15 11:29 genome.genomebits128
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria  432037548 Jan 15 11:29 genome.genomecomp
drwxr-xr-x. 2 luz_garcia_longoria luz_garcia_longoria       4096 Jan 15 11:27 genome.maps
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria   72007680 Jan 15 11:53 genome.ref081locoffsets64meta
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria  660530864 Jan 15 11:53 genome.ref081locoffsets64strm
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 2249041724 Jan 15 11:53 genome.ref081locpositions
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria     140648 Jan 15 11:53 genome.ref081loctable
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria  134217744 Jan 15 11:35 genome.ref153offsets64meta
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria  360216272 Jan 15 11:35 genome.ref153offsets64strm
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 1496235468 Jan 15 11:44 genome.ref153positions
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria          7 Jan 15 11:27 genome.version

(希望我做的正确)

现在,为了“清理”我的程序集(Trinity.fasta文件),我想将Trinity转录重叠群与基因组对齐,但我只想保留那些与基因组不匹配的重叠群。 我一直在阅读gmap提供的--help信息,但是我对使用什么输出选项不清楚。我的想法是这样的:

    gmap -D . -d genome trinity_out_dir/Trinity.fasta --failsonly  -f samse >  trinity_gmap.sam

根据gmap帮助:

--failsonly                    Print only failed alignments, those with no results

因此,从理论上讲,通过使用此命令,程序应将我的程序集与基因组对齐,并创建仅包含与基因组不匹配的重叠群的输出文件,对吗?

请,如果我做错了事,请告诉我。

谢谢

Luz

PS:也许我应该使用--failed-input = STRING和--split-output = STRING之类的其他选项,但不确定!

0 个答案:

没有答案