我在groupby数据框上执行一堆聚合统计信息。特别是对于一列'<%# "Mr " + Eval("ID") & Eval("LastName")%>
,我想要一个计数和一个独特的计数。我不确定如何将它输出到两个名称不同的seaparate列。截至目前,非重复计数只会覆盖计数。
如何将ios_id列的非重复计数和计数输出到两个单独的列?
ios_id
答案 0 :(得分:1)
这样的事情应该有效。请注意iOS_id的嵌套字典结构。
df_new = df.groupby('video_id').agg({"ios_id": {"count": "count",
"distinct": "unique"},
"feed_position": np.average,
"time_watched": np.sum,
"video_length": np.sum})
有关详细信息,请参阅Naming returned columns in Pandas aggregate function: