我有四列数据,其中包括:Id
,CreationDate
,Score
和ViewCount
。
CreationDate
具有下一种格式,例如:2011-11-30 19:41:14.960。
我需要对CreationDate
的年份进行分组,对它们进行计数,同时对Score
和ViewCount
进行求和,并添加到其他列中。
我想和pandas lib一起使用。
谢谢!
更改前-示例示例:
Id CreationDate Score ViewCount
0 1 2011-11-30 19:15:54.070 25 1526
1 2 2011-11-30 19:41:14.960 20 601
2 3 2012-11-30 19:42:45.470 36 1015
3 4 2018-11-30 19:44:55.593 8 1941
4 5 2011-11-30 19:53:23.387 11 5053
5 6 2018-11-30 20:04:43.757 25 5123
6 7 2011-11-30 20:08:23.267 53 8945
更改后-像这样显示数据:
Id CreationDate Score ViewCount
0 1 2011 109 16125
2 3 2012 36 1015
3 4 2018 33 7064
答案 0 :(得分:3)
您可以将Series.dt.year
的列转换为年份,并使用具有聚合功能的列的字典通过GroupBy.agg
进行汇总,最后添加DataFrame.reindex
,必要时可以像原始{{1 }}:
DataFrame