我有一个包含多个基因的字典。元组(zip())给出每个位点的核苷酸。例如。 (A,A,A),(T,T,G)等我试图计算每个位点的核苷酸数。这样站点1显示3个A,站点2显示2个T和1个G.当我运行我的代码时,它只添加到A而没有别的。
List = tuple(zip(*myDict.values()))
A = 0
T = 0
G = 0
C = 0
site = 0
for value in List:
site +=1
if 'A':
A += 1
elif 'T':
T += 1
elif 'G':
G += 1
else:
C =+ 1
print 'Site:', site
print 'A:', A
print 'T:', T
print 'G:', G
print 'C:', C
答案 0 :(得分:7)
您可以(再次),最好地使用collections.Counter()
:
[Counter(site) for site in zip(*myDict.values())]
这将创建每个站点的基因计数列表。
演示:
>>> from collections import Counter
>>> myDict = {'abc':'AGCTAC', 'def': 'AGGTAC', 'ghi':'AGGTAG'}
>>> result = [Counter(site) for site in zip(*myDict.values())]
>>> result
[Counter({'A': 3}), Counter({'G': 3}), Counter({'G': 2, 'C': 1}), Counter({'T': 3}), Counter({'A': 3}), Counter({'C': 2, 'G': 1})]
>>> result[0] # genes at site 0
Counter({'A': 3})
>>> result[2] # genes at site 2
Counter({'G': 2, 'C': 1})
答案 1 :(得分:6)
使用Counter()
:
>>> from collections import Counter
>>> lis=[('A', 'A', 'A'), ('T', 'T', 'G')]
>>> Counter(y for x in lis for y in x)
Counter({'A': 3, 'T': 2, 'G': 1})
或者@Steven Rumbalski建议,使用itertools.chain()
而不是生成器表达式:
>>> from itertools import chain
>>> Counter(chain(*lis))
Counter({'A': 3, 'T': 2, 'G': 1})
对于各个站点的单独计数器,请参阅Martijn Pieters的answer
答案 2 :(得分:6)
ITYM
for value in List:
site +=1
if value == 'A':
A += 1
elif value == 'T':
T += 1
elif value == 'G':
G += 1
else:
C +=1
但还有更好的方法;看到其他答案。
此外,你不能打电话给你的名单List
;大写名称是为类保留的。 list
也不好,因为它隐藏了内置的list()
。
答案 3 :(得分:3)
A = List.count("A")
B = List.count("C")
...
btw List是一个糟糕的变量名称