我正在使用配对末端全基因组测序的bamfile,并希望过滤掉未在适当对中映射的特定基因组区域的读数(这些有时表示结构变体)。我正在使用samtools,并尝试使用"标记"来过滤读取。选项,选择未映射到正确对中的读取。如果我是正确的,那么这些读取的标志值不应该为2。 (https://broadinstitute.github.io/picard/explain-flags.html)
然而,根据samtools,我的所有读数都没有映射到一个合适的对。当我计算(-c)我指定的区域中的所有读数,没有过滤器时,它给我的总计数为179:
samtools view input.bam "8:113483114-113483213" -c
179
当我过滤正确配对的读数时,即标志包含" 2" (-f 2),计数为零:
samtools view input.bam "8:113483114-113483213" -f 2 -c
0
我检查了读取是否被识别为配对(-f 1),并且配对是否被映射(-F 8),并且所有这些都是:
samtools view input.bam "8:113483114-113483213" -f 1 -F 8 -c
179
我也尝试过基因组中的其他区域,到处都遇到同样的问题。 我使用相同的BAM文件检查了IGV中的区域,IGV告诉我大多数读取都是正确配对的,只有少数不是。 有谁知道这里发生了什么? BAM文件是否以不考虑正确配对映射的方式标记?
欢迎任何帮助!非常感谢。