两列Python之间的关系

时间:2016-04-23 09:43:50

标签: python pandas sum

我试图找出如何确定数据框中两列之间的关系。关系是项目和总计之间的关系。我想计算每个'项目'的总金额。值,其中项目是每个篮子的项目数,总数是每个篮子的总数/成本。列:

    Date   Time    Basket   Items   Total

我目前用于获取项目数的每个频率的Python代码是:

items  = result['Items'].value_counts()

我已尝试使用此代码获取总计(以及其他人):

Total_per_Items = result.groupby(['Items','Total'])
Totals = Total_per_Items['Total'].sum()
Totals

并获得此输出:

Items  Total 
1  0.00        0.00
   0.01        0.03
   0.02        0.02
   0.11        0.11
   0.22        0.22
   0.24        0.24
   0.28        0.28
   0.29        0.29

相反,我希望获得类似的内容:

Items    Total
1        10500.65
2        2300.50
3        3450.34

我编制了上面的输出,但我确定你得到了漂移。它让我被烘焙了。

1 个答案:

答案 0 :(得分:0)

这为Total Item提供了总和:

result.groupby(['Items'])['Total'].sum()

示例:

>>> result = pd.DataFrame({'Items': [1, 2, 3, 2, 1, 2, 3],
                           'Total': [10, 20, 30, 20, 10, 20, 30]})
>>> result.groupby(['Items'])['Total'].sum()
Items
1    20
2    60
3    60
Name: Total, dtype: int64

这为您提供了一个数据帧:

>>> result.groupby(['Items'])['Total'].sum().to_frame()

       Total
Items       
1         20
2         60
3         60