计算多索引数据框中的不同行

时间:2018-11-29 07:33:47

标签: python-3.x dataframe multi-index

我有下面的数据子集,它显示了一个击球手有关他在各局中得分的跑步次数的信息。

data subset

现在,我对“击球手”和“限制”进行了分组。我已经计算了局数,面对的球数和他得分的总和,以确定每个局中他得分了多少次。

下面是“分组依据”语句。

batsman_data_2 = deliveries_data.groupby(['batsman','inning']).aggregate({
    'inning': 'count',
    'ball': 'count',
    'batsman_runs': 'sum'
    })

实际输出。 Actual Output

预期输出 Expected Output

这里的问题是“局”不被认为是唯一的。相反,只要有特定值,它就会计算所有行。例如,在上面给出的子集中,一局的计数应该为1,而对于一局2的计数应该为1。取而代之的是分别为6和5,这不过是面对的球数。

因此,我的问题是在这种情况下如何为每个局取唯一值。

希望我能得到帮助,在此先谢谢!! Mukund G Kallapur

0 个答案:

没有答案