Question

我在groupby数据框上执行一堆聚合统计信息。特别是对于一列'<%# "Mr " + Eval("ID") & Eval("LastName")%>，我想要一个计数和一个独特的计数。我不确定如何将它输出到两个名称不同的seaparate列。截至目前，非重复计数只会覆盖计数。

如何将ios_id列的非重复计数和计数输出到两个单独的列？

ios_id

Answer 1

这样的事情应该有效。请注意iOS_id的嵌套字典结构。

df_new = df.groupby('video_id').agg({"ios_id": {"count": "count",
                                                "distinct": "unique"},
                                     "feed_position": np.average,
                                     "time_watched": np.sum,
                                     "video_length": np.sum})

有关详细信息，请参阅Naming returned columns in Pandas aggregate function：

如何在一个groupby列上执行聚合选项，提供两个列输出

1 个答案: