python按键排序字典,按另一个键列表

时间:2013-10-30 16:11:19

标签: python

我有一个词典列表,只需要带有唯一项目名称的项目,但只需要具有最新结束时间的词典。

例如:

query_result = (
{item: 'name1', starttime ='2013-10-29 07:28:14', endtime = '2013-10.29 08:28:14'}, 
{item: 'name1', starttime ='2013-10-29 08:28:14', endtime = '2013-10.29 09:28:14'},
{item: 'name1', starttime ='2013-10-29 07:28:14', endtime = '2013-10.29 08:28:14'},
{item: 'name2', starttime ='2013-10-29 07:28:14', endtime = '2013-10.29 07:29:14'},
{item: 'name2', starttime ='2013-10-29 07:28:14', endtime = '2013-10.29 07:45:14'},
{item: 'name2', starttime ='2013-10-29 07:28:14', endtime = '2013-10.29 08:28:14'} )

所以结果应该是

({item1: 'name1', starttime ='2013-10-29 07:28:14', endtime = '2013-10.29 09:28:14'},
 {item2: 'name2', starttime ='2013-10-29 07:28:14', endtime = '2013-10.29 08:28:14'})

任何提示?

更新

如果结束时间已采用日期时间格式,该怎么办?

 {item: 'name1', starttime : datetime.datetime(2013, 10, 30, 7, 13, 21), endtime:datetime.datetime(2013, 10, 30, 7, 13, 21}

3 个答案:

答案 0 :(得分:1)

按降序结束时间排序,然后取每个名称的第一个:

import datetime
def endtime_sort_key(item):
    return datetime.datetime.strptime(item['endtime'], "%Y-%m.%d %H:%M:%S")

used_names = set()
final_result = []
for item in sorted(query_result, key=endtime_sort_key, reverse=True):
    if item['item'] not in used_names:
        final_result.append(item)
        used_names.add(item['item'])

答案 1 :(得分:1)

我认为itertools.groupby(iterable[, key])在这里很有帮助。

您可以使用键item按项目对数据进行分组,然后选择所需的项目

used_names = set()
final_result = []
for k, g in itertools.groupby(query_result, key=lambda x: x['item']):
    final_result.append(sorted(g, key=lambda item: item['endtime'], reverse=True)[0])

如果end_time项是字符串你应该先剥离

import datetime
def endtime_sort_key(item):
    return datetime.datetime.strptime(item['endtime'], "%Y-%m.%d %H:%M:%S")

used_names = set()
final_result = []
for k, g in itertools.groupby(query_result, key=lambda x: x['item']):
    final_result.append(sorted(g, key=endtime_sort_key, reverse=True)[0])

答案 2 :(得分:0)

from time import strptime

result = []
for i in query_result:
    tmp = {}
    for j in (k for k in query_result if k['item'] == i['item']):
        if strptime(j['endtime'], '%Y-%m.%d %I:%M:%S') > strptime(i['endtime'], '%Y-%m.%d %I:%M:%S'):
            tmp['item'] = j['item']
            tmp['starttime'] = j['starttime']
            tmp['endtime'] = j['endtime']
    if(tmp and tmp not in result):
        result.append(tmp)

result = (tuple(result))