如何在一个groupby列上执行聚合选项,提供两个列输出

时间:2015-05-30 15:55:39

标签: python pandas

我在groupby数据框上执行一堆聚合统计信息。特别是对于一列'<%# "Mr " + Eval("ID") & Eval("LastName")%> ,我想要一个计数和一个独特的计数。我不确定如何将它输出到两个名称不同的seaparate列。截至目前,非重复计数只会覆盖计数。

如何将ios_id列的非重复计数和计数输出到两个单独的列?

ios_id

1 个答案:

答案 0 :(得分:1)

这样的事情应该有效。请注意iOS_id的嵌套字典结构。

df_new = df.groupby('video_id').agg({"ios_id": {"count": "count",
                                                "distinct": "unique"},
                                     "feed_position": np.average,
                                     "time_watched": np.sum,
                                     "video_length": np.sum})

有关详细信息,请参阅Naming returned columns in Pandas aggregate function