我试图找出如何确定数据框中两列之间的关系。关系是项目和总计之间的关系。我想计算每个'项目'的总金额。值,其中项目是每个篮子的项目数,总数是每个篮子的总数/成本。列:
Date Time Basket Items Total
我目前用于获取项目数的每个频率的Python代码是:
items = result['Items'].value_counts()
我已尝试使用此代码获取总计(以及其他人):
Total_per_Items = result.groupby(['Items','Total'])
Totals = Total_per_Items['Total'].sum()
Totals
并获得此输出:
Items Total
1 0.00 0.00
0.01 0.03
0.02 0.02
0.11 0.11
0.22 0.22
0.24 0.24
0.28 0.28
0.29 0.29
相反,我希望获得类似的内容:
Items Total
1 10500.65
2 2300.50
3 3450.34
我编制了上面的输出,但我确定你得到了漂移。它让我被烘焙了。
答案 0 :(得分:0)
这为Total
Item
提供了总和:
result.groupby(['Items'])['Total'].sum()
示例:
>>> result = pd.DataFrame({'Items': [1, 2, 3, 2, 1, 2, 3],
'Total': [10, 20, 30, 20, 10, 20, 30]})
>>> result.groupby(['Items'])['Total'].sum()
Items
1 20
2 60
3 60
Name: Total, dtype: int64
这为您提供了一个数据帧:
>>> result.groupby(['Items'])['Total'].sum().to_frame()
Total
Items
1 20
2 60
3 60