我正在尝试遍历字典:
Geno[data[0]][data[1]][Sample[i]] = data[i+2]
我希望通过迭代第一个两个键来生成[data[0]][data[1]][Sample[i]]
的所有值,以获得第三个Sample键的子集列表所满足的所有可能值。我有190个样本。我想比较父母和后代的基因型A / B,以确定哪个父母贡献了哪个位置(Chromsome x Position)。从190个样本中有不同的父母/后代组合,我使用正则表达式将其分组到列表中。
我的问题:当子集存在时,如何通过查询所有键的嵌套字典Geno [data [0]] [data [1]]] [样本的子集]来迭代所有(Chrom X Pos)在样本名称列表中。
字典结构源自制表符分隔文件:
for line in inGTfile:
data = line.rstrip().split("\t")
for i in range(len(Sample)):
Geno[data[0]][data[1]][Sample[i]] = data[i+2]
CHROM POS样品1样品2样品3
1 1611172 A A A
1 2565208 B B B