Question

我写了一个应该很快的lambda函数，但这需要很长时间。有没有更好的方法来写这个？

fn = lambda x: shape(df[df.CustomerCard_Num == x.CustomerCard_Num])[0]
df['tottrans'] = df.apply(fn, axis = 1)

基本上，我有一个庞大的交易数据库（行）。一组行可能对应于不同的客户（如果df中的列，多行可能具有相同的df.CustomerCard_Num，则为客户卡号。）

我试图用这个lambda函数计算每个客户的行数。但它似乎没有迅速奏效。我应该使用groupby吗？

Answer 1

内置方式：

df.CustomerCard_Num.value_counts()

请参阅docs