我有一个熊猫数据框,里面装有我要分组的会计记录->记录,但是我不太清楚要使用哪种方法。
这是原始数据框:
person_id|statement_date|expense_type|amount
--------------------------------------------
1 |1/1 |coffee |5.00
1 |1/1 |bagel |3.00
1 |1/1 |ticket |8.00
1 |2/1 |coffee |5.00
1 |2/1 |donut |4.00
1 |2/1 |ticket |8.00
2 |1/1 |coffee |5.00
2 |1/1 |bagel |3.00
2 |1/1 |ticket |8.00
2 |2/1 |coffee |5.00
2 |2/1 |donut |4.00
2 |2/1 |ticket |8.00
我希望将支出定位为列,而不是将每行包含一个支出项目,而每个记录都是person_id
+ statment_date
,就像这样:
person_id|statement_date|coffee|bagel|ticket|donut
--------------------------------------------------
1 |1/1 |5.00 |3.00 |8.00 |na
1 |2/1 |5.00 |na |8.00 |3.00
2 |1/1 |5.00 |3.00 |8.00 |na
2 |2/1 |5.00 |na |8.00 |3.00
以下groupby即将关闭:
df.groupby(['person_id', 'statement_date','expense_type']).sum()
但是我希望最后一项'expense_type'变成cols。
我确定我可以使用某种应用程序,但我只是无法弄清楚。
谢谢!