熊猫,groupby和其他列中的数据计数

时间:2019-03-19 12:46:00

标签: python pandas numpy data-science data-analysis

我有四列数据,其中包括:IdCreationDateScoreViewCount

CreationDate具有下一种格式,例如:2011-11-30 19:41:14.960。 我需要对CreationDate的年份进行分组,对它们进行计数,同时对ScoreViewCount进行求和,并添加到其他列中。

我想和pandas lib一起使用。

谢谢!

更改前-示例示例:

     Id   CreationDate              Score   ViewCount
0    1    2011-11-30 19:15:54.070   25      1526
1    2    2011-11-30 19:41:14.960   20      601
2    3    2012-11-30 19:42:45.470   36      1015
3    4    2018-11-30 19:44:55.593   8       1941
4    5    2011-11-30 19:53:23.387   11      5053
5    6    2018-11-30 20:04:43.757   25      5123
6    7    2011-11-30 20:08:23.267   53      8945

更改后-像这样显示数据:

     Id   CreationDate              Score   ViewCount
0    1    2011                      109     16125
2    3    2012                      36      1015
3    4    2018                      33      7064                            

1 个答案:

答案 0 :(得分:3)

您可以将Series.dt.year的列转换为年份,并使用具有聚合功能的列的字典通过GroupBy.agg进行汇总,最后添加DataFrame.reindex,必要时可以像原始{{1 }}:

DataFrame