csv文件csv_file.csv
中有一个数据集,其样本结构如下:
state_code,year,month,value
01,2012,M01, 8.1
01,2012,M02, 8.0
01,2012,M03, 8.0
01,2012,M04, 8.1
01,2012,M05, 8.2
01,2012,M06, 8.2
01,2012,M07, 8.2
01,2012,M08, 8.1
01,2012,M09, 7.9
01,2012,M10, 7.8
01,2012,M11, 7.7
01,2012,M12, 7.6
我还有另一个csv文件,其状态代码映射到状态名称 - states.csv
:
state_code,state_name
01,Alabama
02,Alaska
04,Arizona
05,Arkansas
06,California
08,Colorado
09,Connecticut
现在我要做的是csv_file.csv
我希望将月度数据中的value
数据转换为每年和每个州的季度数据,取每月平均数值。例如,对于状态01
,我有12个月的数据(M01
到M12
),我想通过平均每3个月将其转换为季度数据(平均值为{{ 1}},M01
,M02
制作M03
等等。我想为每个州每年做一次。最后,我想将结果写入新的csv文件,将Q01
替换为来自state_code
数据的映射中的state_name
。所以期望的输出应该是这样的:
state.csv
我知道如何读取/写入csv并将其作为:
state,year,quarter,value
Alabama,2012,Q01,6.5
Alabama,2012,Q02,6.0
Alabama,2012,Q03,6.1
Alabama,2012,Q04,5.7
Alabama,2013,Q01,6.2
.
.
.
如何在python中进行上述数据平均?