Question

是的，这个网站上有很多关于装配python字典的问题。但是我所看到的一切都没有达到我想做的事情。所以，我有一本字典。它包含一些列表和一些数据值列表。像

这样的东西

data_and_time = {"time":['2:30','2:45','3:25','5:15','7:21','8:22'],
                 "data":[    5.,    7.,    2.,    3.,    8.,   10.]}

我想过滤这个，以便，例如，我只有大于或等于5的数据值。结果是：

data_and_time_5 = {"time":['2:30','2:45','7:21','8:22'],
                   "data":[    5.,    7.,    8.,   10.]}

我可以想到一些方法来做到这一点 - 所有这些都非常难看并且需要多行代码。我想要一种优雅，可读的方式来做到这一点。 python词典有这样的方法吗？（顺便说一下，时间表示为字符串是完全偶然的，这只是我在这里表达问题的一种紧凑方式。）谢谢。

Answer 1

我首先要以更好的，类似JSON的格式存储数据：

data = [dict(zip(data_and_time, val)) for val in zip(*data_and_time.values())]

看起来像这样：

>>> data
    [{'data': 5.0, 'time': '2:30'},
 {'data': 7.0, 'time': '2:45'},
 {'data': 2.0, 'time': '3:25'},
 {'data': 3.0, 'time': '5:15'},
 {'data': 8.0, 'time': '7:21'},
 {'data': 10.0, 'time': '8:22'}]

现在，您可以更轻松地过滤对象：

>>> [item for item in data if item['data'] >= 5.0]
    [{'data': 5.0, 'time': '2:30'},
 {'data': 7.0, 'time': '2:45'},
 {'data': 8.0, 'time': '7:21'},
 {'data': 10.0, 'time': '8:22'}]

Answer 2

我会选择Blender的方法。但是，如果您想坚持使用当前的数据结构，可以使用dict / list comprehensions：

data_and_time = { k: [i for i in v if i >= 5] for k, v in data_and_time.iteritems() }

当然，你必须修改i＆gt; = 5部分来处理日期格式。我没有把它包含在这里，因为你提到了你在这里只是为了简化你的例子。

希望有所帮助。

Answer 3

如果您需要保留数据结构：

data_and_time = {"time": ['2:30', '2:45', '3:25', '5:15', '7:21', '8:22'],
                 "data": [5., 7., 2., 3., 8., 10.]}

#it builds list like a [True, True, False, ...]    
index = map(lambda x: x >= 5, data_and_time['data'])
#and then 'applies' it to 'columns' of data_and_time
data_and_time = {k: [e for e in itertools.compress(v, index)]
                 for k, v in data_and_time.iteritems()}

结果：

{'data': [5.0, 7.0, 8.0, 10.0],
 'time': ['2:30', '2:45', '7:21', '8:22']}

再次使用Python过滤字典

3 个答案: