所以我的回答如下:
Counter({'APR': 76, 'MAR': 67, 'MAY': 51, 'JUN': 28, 'FEB': 17, 'JAN': 4, 'JUL': 3, 'DEC': 1, 'AUG': 1})
但希望它是月份订单,包括0个计数的月份:
Counter({'JAN': 4, 'FEB': 17, 'MAR': 67, 'APR': 76, 'MAY': 51, 'JUN': 28, 'JUL': 3, 'AUG': 1, 'SEP': 0, 'OCT': 0, 'NOV': 0, 'DEC': 1})
我的项目导入带有值列表的.csv文件(大约有1400个,但这里有一些示例)并返回月份发生的次数:
year,month,age,sex
2013,JUN,20,M
2011,MAR,29,F
2011,JUL,26,M
2011,APR,20,M
我当前的代码看起来像这样(我现在只看到10年的回报)
def parse_data(filename):
with open('case_list.csv', 'r') as f:
temp_read = csv.reader(f)
month = ['JAN', 'FEB', 'MAR', 'APR', 'MAY', 'JUN', 'JUL', 'AUG', 'SEP', 'OCT', 'NOV', 'DEC']
year = ['2010', '2011', '2012', '2013', '2014']
read, year10, year11, year12, year13, year14 = [], [], [], [], [], []
for i in temp_read:
if i[0] in year and i[1] in month:
read.append(i[0:2])
for j in read:
if j[0].startswith('2010'):
year10.append(j[1])
if j[0].startswith('2011'):
year11.append(j[1])
if j[0].startswith('2012'):
year12.append(j[1])
if j[0].startswith('2013'):
year13.append(j[1])
if j[0].startswith('2014'):
year14.append(j[1])
return Counter(year10)
背景问题:
您可以假设文件格式正确(即,从上例中的标题行开始)。 您可以假设每个记录都已正确格式化,但您的函数应该只计算有效记录。有效记录是具有年和月有效值的记录。 有效年份为:2010年,2011年,2012年,2013年,2014年 有效月份是:JAN,FEB,MAR,APR,MAY,JUN,JUL,AUG,SEP,OCT,NOV,DEC 应忽略无效记录
答案 0 :(得分:2)
不幸的是,Counter
个对象无法保持秩序。但是,OrderedDict
s 执行。您可以使用生成器理解将Counter
转换为OrderedDict
并将其传递给构造函数。
month = ['JAN', 'FEB', 'MAR', 'APR', 'MAY', 'JUN',
'JUL', 'AUG', 'SEP', 'OCT', 'NOV', 'DEC']
o = OrderedDict((m, c[m]) for m in month if c[m] > 0)
print(o)
OrderedDict([('JAN', 4),
('FEB', 17),
('MAR', 67),
('APR', 76),
('MAY', 51),
('JUN', 28),
('JUL', 3),
('AUG', 1),
('DEC', 1)])
我添加了一个条件来忽略计数为0
的月份。如果您需要这些,您的代码会使用map
:
o = OrderedDict(map(lambda m: (m, c[m]), month))
print(o)
OrderedDict([('JAN', 4),
('FEB', 17),
('MAR', 67),
('APR', 76),
('MAY', 51),
('JUN', 28),
('JUL', 3),
('AUG', 1),
('SEP', 0),
('OCT', 0),
('NOV', 0),
('DEC', 1)])