我想基于两列的值来汇总我的熊猫数据报中的值。 (Python 3.x)
我已经尝试使用groupby函数和类似的方法,但是由于我对本主题还比较陌生,因此需要一些帮助。
这是我处理的数据的示例:
Date | ID | Count
2019-01-01 | 300020 | 1
2019-01-01 | 300020 | 1
2019-01-01 | 300020 | 1
2019-02-01 | 660020 | 1
2019-02-01 | 300020 | 1
2019-03-01 | 760020 | 1
2019-03-01 | 300020 | 1
2019-03-01 | 300020 | 1
2019-03-01 | 760020 | 1
最终结果应该是:
Date | ID | Count
2019-01-01 | 300020 | 3
2019-02-01 | 660020 | 1
2019-02-01 | 300020 | 1
2019-03-01 | 760020 | 2
2019-03-01 | 300020 | 2
任何帮助将不胜感激!
答案 0 :(得分:2)
这更像groupby
yourdf=df.groupby(['Date','ID'],sort=False, as_index=False)['Count'].sum()