我们假设我们有一个包含以下列的pandas数据框:group
,'val1',val2
。现在我想使用名为group
的列进行分组。然后,结果,我想要一个包含以下列的表:
val1
的最小值(对于组)。我想将此专栏称为min_val1
val1
的值(对于组)的总和。我想将此列称为sum_val1
val2
中的不同值的数量。我想将此列称为distinct_val2
。我可以这样做:
df.groupby('group', as_index=False).agg({
'min_val1' : lambda x : min(x['val_1']),
'sum_val1' : lambda x : sum(x['val1']),
'distinct_val2' : lambda x : distinct(x['val2'])
})
上面给出的代码不起作用,但是有类似的东西会起作用吗?