用字符串排序的Python列表

时间:2017-08-27 12:01:47

标签: python list sorting

我有一个很短的字符串列表,其中包含按小时计算的天气信息,这里是:

bad_list =['00:00',  '-2°C', '-6°C', '320°13 Km/h', 'N/A', '74%', '-6°C', '1025,0mb', '',  
'01:00', '-1°C', '-3°C', '320°6 Km/h', 'N/A', '75%', '-5°C', '1024,0mb', '',
'02:00', '-3°C', '-5°C', '270°6 Km/h', 'N/A', '86%', '-5°C', '1023,0mb', '',
 .....(skipped hours from 03 till 09)
 '09:04',  '9°C', '5°C', '290°35 Km/h', 'N/A', '66%', '3°C', '1022,0mb', '',
 '10:00', '9°C', '5°C', '290°37 Km/h', 'N/A', '62%', '2°C', '1022,0mb', '',
 '10:27', '10°C', '6°C', '280°39 Km/h', 'N/A', '58%', '2°C', '1023,0mb', '',
 '11:02', '11°C', '11°C', '290°35 Km/h', 'N/A', '54%', '2°C', '1022,0mb', '',
 '11:10', '12°C', '12°C', '290°37 Km/h', 'N/A', '47%', '1°C', '1022,0mb', '',
  .....(skipped)
 '23:00', '3°C', '3°C',  'N/A', '52%', '-6°C', '1020,0mb', '',
 ]

问题是在列表中,小时字符串像示例一样凌乱,有'10:00'和'10:27'。我正在尝试的是每小时(从00:00到23:00)收集临时(一小时后的下一个索引字符串)。该列表中一小时内有超过24个字符串(以及相应的天气信息!)。 所以我想找到一小时的第一次出现,然后将列表中的下一个索引作为相应的温度:

unique_time = ['00:','01:','02:','03:','04:','05:','06:','07:','08:','09:','10:','11:','12:','13:','14:','15:','16:',
        '17:','18:','19:','20:','21:','22:','23:']

sorted_time_list = next(x for x in unique_time if x in bad_list) #not working

在bad_list中获取与sorted_time_list相对应的+1索引字符串。我知道这听起来很难看,但我想在24小时内获得临时字符串(bad_list中小时字符串之后的第二个元素)。

我知道这听起来不太清楚。如果需要更多细节,请拍我:)

2 个答案:

答案 0 :(得分:4)

将您的项目分为9个项目(使用grouper iterator),然后按每个小时的小时分组:

from itertools import groupby, zip_longest

def grouper(iterable, n, fillvalue=None):
    args = [iter(iterable)] * n
    return zip_longest(*args, fillvalue=fillvalue)

by_hour = groupby(grouper(bad_list, 9), lambda g: g[0][:2])

temp_list = [(hour, next(entries)[1]) for hour, entries in by_hour]

这会生成一个(hour, temp)元组列表,其中会生成给定小时的第一个温度。

演示您的给定数据:

>>> from itertools import groupby, zip_longest
>>> def grouper(iterable, n, fillvalue=None):
...     args = [iter(iterable)] * n
...     return zip_longest(*args, fillvalue=fillvalue)
...
>>> by_hour = groupby(grouper(bad_list, 9), lambda g: g[0][:2])
>>> [(hour, next(entries)[1]) for hour, entries in by_hour]
[('00', '-2°C'), ('01', '-1°C'), ('02', '-3°C'), ('09', '9°C'), ('10', '9°C'), ('11', '11°C'), ('23', '3°C')]

答案 1 :(得分:0)

我是python中的绿手,我尝试使用自己的方法来解决这个问题。 其次是我的代码。

final_result={}
for x, y in enumerate(unique_time):
    if (y in bad_list):
        final_result[y]=bad_list[x+1]
print(final_result)