sample = [['CGG','ATT'],['GCGC','TAAA']]
base_counts = [[Counter(base) for base in sub] for sub in sample]
#Output : [[Counter({'G': 2, 'C': 1}), Counter({'T': 2, 'A': 1})], [Counter({'C': 2, 'G': 2}), Counter({'A': 3, 'T': 1})]]
base_freqs = [[{k_v[0]:k_v[1]/len(bases[i]) for i,k_v in enumerate(count.items())} for count in counts] for counts, bases in zip(base_counts, sample)]
#Output 2 [[{'C': 0.3333333333333333, 'G': 0.6666666666666666}, {'A': 0.3333333333333333, 'T': 0.6666666666666666}], [{'C': 0.5, 'G': 0.5}, {'A': 0.75, 'T': 0.25}]]
示例是输入,Output2是程序的最终输出。使用base_freqs的程序计算" base"的频率。每对样品中的(碱= ATGC)。输出提供正确的答案。但是,我希望看到for循环格式的代码而不是理解。
此代码最初取自发布的here
答案 0 :(得分:2)
是。在外面和从左到右阅读理解的方法。为了便于阅读,我们将其格式化一下:
base =[
[
{ k_v[0] : k_v[1]/len(bases[i])
for i,k_v in enumerate(count.items())
}
for count in counts
]
for counts, bases in zip(base_counts, sample)
]
与:
相同bases = []
for counts, bases in zip(base_counts, sample):
temp_list = []
for count in counts:
temp_dict = {}
for i, k_v in enumerate(count.items()):
temp_dict[k_v[0]] = k_v[1] / len(bases[i])
temp_list.append(temp_dict)
bases.append(temp_list)
从性能的角度来看,列表理解更好,因为你不是经常创建新的列表和dicts,或者调用像append这样的方法,这些方法有一些开销。
答案 1 :(得分:2)
您始终可以翻译列表理解,例如
ls = [<EXPR> for <VARS> in <ITERABLE> if <CONDITIONAL>]
到
ls = []
for <VARS> in <ITERABLE>:
if <CONDITIONAL>:
ls.append(<EXPR>)
理解中的多个for
子句对应于转换中的嵌套for
循环,最左边的for
子句对应于最外面的for
循环。
生成器,字典和集合理解的翻译是类似的。
答案 2 :(得分:1)
使用for循环并不是那么容易,但是它应该是这样的。
result = []
for counts, bases in zip(base_counts, sample):
some_list = []
for count in counts:
some_dict = {}
for i,k_v in enumerate(count.items()):
some_dict[k_v[0]] = k_v[1]/len(bases[i])
some_list.append(some_dict)
result.append(some_list)