Question

我在Python中有2个具有以下格式的嵌套词典：

1166869: {'probL2': '0.000', 'probL1': '0.000', 'pronNDiff_site': '1.000', 'StateBin': '0', 'chr': 'chrX', 'rangehist': '59254000-59255000', 'start_bin': '59254000', 'countL2': '4', 'countL1': '0'} 

1166870: {'probL2': '0.148', 'probL1': '0.000', 'pronNDiff_site': '0.851', 'StateBin': '0', 'chr': 'chr2', 'rangehist': '59254000-59255000', 'start_bin': '59255000', 'countL2': '5', 'countL1': '15'} 

1166871: {'probL2': '0.000', 'probL1': '0.000', 'pronNDiff_site': '1.000', 'StateBin': '0', 'chr': 'chrY', 'rangehist': '59290000-59291000', 'start_bin': '59290000', 'countL2': '1', 'countL1': '2'}

其中1166869,11668和1166871表示我从中读取数据的文件中的一行，其余的键是数据本身。

现在我想制作一个列表，我将所有不同的值存储在键“chr”中，因为有一些重复的值。

如何浏览字典并对2个值进行比较？此代码无效：

for k in range(len(file_dict)):
    for j in range(len(file_dict)-1):
        if (file_dict[j]["chr"] != file_dict[k]["chr"]):
            list_chr.append(file_dict[j]["chr"])

Answer 1

使用一套，只需一次性使用所有项目：

chr = { v['chr'] for v in file_dict.itervalues() }

这使用集合理解来在一行代码中生成集合。

在Python 2.7中引入了集合理解;在早期版本中使用：

chr = set(v['chr'] for v in file_dict.itervalues())

在Python 3中，您需要将.itervalues()替换为.values()。

你自己的代码不起作用，因为python词典不是列表;您不是按索引检索值，而是按键检索值。您必须将其更改为：

for key in file_dict:
    for other_key in file_dict:
        if key == other_key:
            continue

        if file_dict[key]['chr'] != file_dict[otherkey]['chr']:
            list_chr.append(filed_dict[key]['chr'])

但真的效率低下，更不用说错误了。

Answer 2

如何处理以下内容：

list_chr = list(set([val['chr'] for val in file_dict.values()]))

这是如何工作的？

首先，列表理解获取内部字典中的所有chr条目然后将它们转换为集合，这样就没有重复的条目然后将这些转换为列表，如果这是您喜欢的格式

请注意，也许你真的想要使用一套，然后查找时间是O（1）而不是O（n）

比较字典python中的值

2 个答案: