在使用samtools的配对末端测序bamfile中,没有读取映射到正确的对

时间:2017-12-20 22:10:02

标签: alignment genome samtools

我正在使用配对末端全基因组测序的bamfile,并希望过滤掉未在适当对中映射的特定基因组区域的读数(这些有时表示结构变体)。我正在使用samtools,并尝试使用"标记"来过滤读取。选项,选择未映射到正确对中的读取。如果我是正确的,那么这些读取的标志值不应该为2。 (https://broadinstitute.github.io/picard/explain-flags.html

然而,根据samtools,我的所有读数都没有映射到一个合适的对。当我计算(-c)我指定的区域中的所有读数,没有过滤器时,它给我的总计数为179:

samtools view input.bam "8:113483114-113483213"  -c

179

当我过滤正确配对的读数时,即标志包含" 2" (-f 2),计数为零:

samtools view input.bam "8:113483114-113483213"  -f 2 -c

0

我检查了读取是否被识别为配对(-f 1),并且配对是否被映射(-F 8),并且所有这些都是:

samtools view input.bam "8:113483114-113483213"  -f 1 -F 8  -c
179

我也尝试过基因组中的其他区域,到处都遇到同样的问题。 我使用相同的BAM文件检查了IGV中的区域,IGV告诉我大多数读取都是正确配对的,只有少数不是。 有谁知道这里发生了什么? BAM文件是否以不考虑正确配对映射的方式标记?

欢迎任何帮助!非常感谢。

0 个答案:

没有答案