从字符串生成重叠的gapped-kmer

时间:2018-05-30 01:31:55

标签: python

我有一个像HDHDJDUEUEUD这样的字符串,我想用给定的k和m(两者之间的最大间隙数)来制作所有间隙的kmers。

例如,当k = 3且m = 2时,我们有两个长度为3的子序列,由长度为0,1或2的间隙(可以表示为句点)分隔,如下所示:

HDHDJD,HDH.JDU,HDH..DUE,DHDJDU等

如何以有效的方式完成?我有一个超过100万个序列的列表来执行此操作。

谢谢!

0 个答案:

没有答案