Illumina HiSeq / MiSeq配对末端读数是什么样的?

时间:2015-09-09 17:15:12

标签: dna-sequence sequencing

我的理解是来自Illumina HiSeq / MiSeq平台的成对末端读取看起来像这样:

R1:
    AAAAAACCCCCC
R2:
    GGGGGGTTTTTT

R2中的读数与R1中的读数相反。然而,对于我的测序数据,情况似乎并非如此。如果它有助于我从下面的一个MiSeq运行中读取一对。

R1:
@M01814:86:000000000-A6MU9:1:1101:15397:1339 1:N:0:2
TACTCGCACCTATCCGGCACAGCAACACCATCTGGGGCTGAATCGCAATAGCATCTCTCACTTCCTCCATATCAGATTGCTCAAGGCAAGCACTACGCTGCAGTGCCCTCCACTCCCAATTCCCTGATGCTGGTCGTAACTTGCCACACCA
+
>>AA?BBBBBFFGGG2EEEGFBGHHHGA2FGHBGHF2EE?GHGHHFFEEHDGHEFGF5FEEFBGHGBCB5FHHH5F553@434FF31G11??233B1/1/?333B?3FB?/B24B2/2B2?44?3?23333B223<>@0CB22@2@F0/?/

R2:
@M01814:86:000000000-A6MU9:1:1101:15397:1339 2:N:0:2
TAAGGGGCCTAGAACAGGCACCATACATTCAATTGGCTGTGGCAAGTAACAACCAGCATCAGGGAATGTGGAGTGGAGGGCACTGCAGCGAATTGCTTGCCTTGAACAATCTTATATGGGGGAAGTAGACGAACCAATGTGGAGTCAGCCC
+
>AA>>>ADDAFFGGGGG4FGGGFHFHFHHHFHHHB3B32EFBGGE25FGHHHHACEGG533BAGFFF355331BG1@1>EF1E23F333/>//134B43?F34B3334B334444?443B?/<C/23333////<0/<11111/?01?G0?

1 个答案:

答案 0 :(得分:1)

简答:通常R1和R2不是彼此的反向互补。 更长的回答: 反向读取以相反的方式排序,但反向读取的内容不一定是正向读取的反向补码。 大多数情况下,您想要测序的DNA片段比MiSeq实际可以测序的~100bp(或高达300bp,取决于来源)长很多。因此,片段的末端是有序的,你只知道正向和反向读取的顺序以及它们相隔多远(如果我没记错的话,内部配合距离)。 Illumina网站上的这张图表显示了这一点。 假设您可以对10bp进行排序,并希望对长度为25的片段进行排序: --- ---- R1&GT; AAAAACCCCCGGGGGTTTTTAAAAA                &LT; ---- --- R2 在这种情况下,你的内部配合距离是5(读数之间的不连续基数nr),你将得不到读数之间序列的信息(在这个例子中是所有的Gs)。如果您分析这样的较小片段大小 --- ---- R1&GT; AAAAACCCCCGGGGG      &LT; ---- --- R2 你的读数重叠,你得到一个负的内部配合距离。然后你会得到一些你所描述的冗余信息,但通常情况并非如此。 你可以在这里找到另一篇有用的文章。 我希望这有帮助。