按月订购计数器键

时间:2017-09-23 04:55:43

标签: python list function counter

所以我的回答如下:

Counter({'APR': 76, 'MAR': 67, 'MAY': 51, 'JUN': 28, 'FEB': 17, 'JAN': 4, 'JUL': 3, 'DEC': 1, 'AUG': 1})

但希望它是月份订单,包括0个计数的月份:

Counter({'JAN': 4, 'FEB': 17, 'MAR': 67, 'APR': 76, 'MAY': 51, 'JUN': 28, 'JUL': 3, 'AUG': 1, 'SEP': 0, 'OCT': 0, 'NOV': 0, 'DEC': 1})

我的项目导入带有值列表的.csv文件(大约有1400个,但这里有一些示例)并返回月份发生的次数:

year,month,age,sex
2013,JUN,20,M
2011,MAR,29,F
2011,JUL,26,M
2011,APR,20,M

我当前的代码看起来像这样(我现在只看到10年的回报)

def parse_data(filename):
    with open('case_list.csv', 'r') as f:
        temp_read = csv.reader(f)
        month = ['JAN', 'FEB', 'MAR', 'APR', 'MAY', 'JUN', 'JUL', 'AUG', 'SEP', 'OCT', 'NOV', 'DEC']
        year = ['2010', '2011', '2012', '2013', '2014']
        read, year10, year11, year12, year13, year14 = [], [], [], [], [], []
        for i in temp_read:
            if i[0] in year and i[1] in month:
                read.append(i[0:2])
        for j in read:
            if j[0].startswith('2010'):
                year10.append(j[1])
            if j[0].startswith('2011'):    
                year11.append(j[1])
            if j[0].startswith('2012'):
                year12.append(j[1])
            if j[0].startswith('2013'):    
                year13.append(j[1])
            if j[0].startswith('2014'):
                year14.append(j[1])
        return Counter(year10)

背景问题:

您可以假设文件格式正确(即,从上例中的标题行开始)。 您可以假设每个记录都已正确格式化,但您的函数应该只计算有效记录。有效记录是具有年和月有效值的记录。 有效年份为:2010年,2011年,2012年,2013年,2014年 有效月份是:JAN,FEB,MAR,APR,MAY,JUN,JUL,AUG,SEP,OCT,NOV,DEC 应忽略无效记录

1 个答案:

答案 0 :(得分:2)

不幸的是,Counter个对象无法保持秩序。但是,OrderedDict s 执行。您可以使用生成器理解将Counter转换为OrderedDict并将其传递给构造函数。

month = ['JAN', 'FEB', 'MAR', 'APR', 'MAY', 'JUN', 
         'JUL', 'AUG', 'SEP', 'OCT', 'NOV', 'DEC']

o = OrderedDict((m, c[m]) for m in month if c[m] > 0)    
print(o) 
OrderedDict([('JAN', 4),
             ('FEB', 17),
             ('MAR', 67),
             ('APR', 76),
             ('MAY', 51),
             ('JUN', 28),
             ('JUL', 3),
             ('AUG', 1),
             ('DEC', 1)])

我添加了一个条件来忽略计数为0的月份。如果您需要这些,您的代码会使用map

进行简化
o = OrderedDict(map(lambda m: (m, c[m]), month))
print(o) 
OrderedDict([('JAN', 4),
             ('FEB', 17),
             ('MAR', 67),
             ('APR', 76),
             ('MAY', 51),
             ('JUN', 28),
             ('JUL', 3),
             ('AUG', 1),
             ('SEP', 0),
             ('OCT', 0),
             ('NOV', 0),
             ('DEC', 1)])