我已经使用来自被寄生虫感染的鸟的读物(通过Trinity)进行了汇编>> Trinity.fasta
我使用以下方法创建了一个基因组索引:
gmap_build -d genome -k 15 GCF_000534875.1_SCA1_genomic.fa
已创建一个名为“基因组”的目录,该目录现在位于:
ll
total 5772532
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 12774633 Jan 15 11:28 genome.chromosome
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 20699247 Jan 15 11:28 genome.chromosome.iit
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 6 Jan 15 11:28 genome.chrsubset
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 19461467 Jan 15 11:28 genome.contig
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 21602471 Jan 15 11:28 genome.contig.iit
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 432037584 Jan 15 11:29 genome.genomebits128
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 432037548 Jan 15 11:29 genome.genomecomp
drwxr-xr-x. 2 luz_garcia_longoria luz_garcia_longoria 4096 Jan 15 11:27 genome.maps
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 72007680 Jan 15 11:53 genome.ref081locoffsets64meta
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 660530864 Jan 15 11:53 genome.ref081locoffsets64strm
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 2249041724 Jan 15 11:53 genome.ref081locpositions
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 140648 Jan 15 11:53 genome.ref081loctable
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 134217744 Jan 15 11:35 genome.ref153offsets64meta
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 360216272 Jan 15 11:35 genome.ref153offsets64strm
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 1496235468 Jan 15 11:44 genome.ref153positions
-rw-rw-r--. 1 luz_garcia_longoria luz_garcia_longoria 7 Jan 15 11:27 genome.version
(希望我做的正确)
现在,为了“清理”我的程序集(Trinity.fasta文件),我想将Trinity转录重叠群与基因组对齐,但我只想保留那些与基因组不匹配的重叠群。 我一直在阅读gmap提供的--help信息,但是我对使用什么输出选项不清楚。我的想法是这样的:
gmap -D . -d genome trinity_out_dir/Trinity.fasta --failsonly -f samse > trinity_gmap.sam
根据gmap帮助:
--failsonly Print only failed alignments, those with no results
因此,从理论上讲,通过使用此命令,程序应将我的程序集与基因组对齐,并创建仅包含与基因组不匹配的重叠群的输出文件,对吗?
请,如果我做错了事,请告诉我。
谢谢
Luz
PS:也许我应该使用--failed-input = STRING和--split-output = STRING之类的其他选项,但不确定!