假设我有一个字母:
A = ['A', 'T', 'C', 'G']
我想生成长度为n(n-mer)的所有可能组合。例如n=2: AA, AT, ..., GG
。为了让事情变得有趣,我正在尝试以动态方式使用列表推导来生成这些内容。这在python中可能吗?唯一明显的路径是使用eval()
并动态生成所需的字符串。但是,我很好奇,看看是否有一个不那么笨重的方法。
答案 0 :(得分:6)
长度为2的每个可能的都是 - (但您可能在permutations
之后combinations
,combinations_with_replacement
或itertools
。 ..)
from itertools import product
A = ['A', 'T', 'C', 'G']
print list(product(A, repeat=2))
[('A', 'A'), ('A', 'T'), ('A', 'C'), ('A', 'G'), ('T', 'A'), ('T', 'T'), ('T', 'C'), ('T', 'G'), ('C', 'A'), ('C', 'T'), ('C', 'C'), ('C', 'G'), ('G', 'A'), ('G', 'T'), ('G', 'C'), ('G', 'G')]
这相当于[(a,b) for a in A for b in A]
,但如果你想要3,4,一千等等,那就更容易扩展......
答案 1 :(得分:5)
>>> from itertools import combinations
>>> A = ['A', 'T', 'C', 'G']
>>> print list(combinations(A,2))
[('A', 'T'), ('A', 'C'), ('A', 'G'), ('T', 'C'), ('T', 'G'), ('C', 'G')]
或者可能(以获得重复):
>>> from itertools import combinations_with_replacement
>>> print list(combinations_with_replacement(A,2))
[('A', 'A'), ('A', 'T'), ('A', 'C'), ('A', 'G'), ('T', 'T'), ('T', 'C'), ('T', 'G'), ('C', 'C'), ('C', 'G'), ('G', 'G')]
答案 2 :(得分:1)
假设您不同时需要'AT'
和'TA'
,那么itertools.combinations_with_replacement()
可能正是您所寻找的:
>>> from itertools import combinations_with_replacement
>>> A = ['A', 'T', 'C', 'G']
>>> [''.join(x) for x in combinations_with_replacement(A, 2)]
['AA', 'AT', 'AC', 'AG', 'TT', 'TC', 'TG', 'CC', 'CG', 'GG']