我有一个如下所示的数据框(df):
visitor label response products number pct
abc123 color blue 3 1 0.333
def456 size 4 x 4 5 5 1.0
def456 shape round 5 5 1.0
我使用以下代码创建了一个新的数据框,其中只有pct = 1.0的记录:
df2 = df
df2["pct"] = 1.0
然后我想通过名为num_same的新列来计算访问者的记录数。我试过这个:
df2["num_same"] = df2.groupby("visit_id").aggregate('count')
但我的结果都是NaN。
我也尝试过:
df2["num_same"] = df2.groupby("visit_id").size()
如何在没有NaN的情况下获得我想要的结果?