我写了一个应该很快的lambda函数,但这需要很长时间。有没有更好的方法来写这个?
fn = lambda x: shape(df[df.CustomerCard_Num == x.CustomerCard_Num])[0]
df['tottrans'] = df.apply(fn, axis = 1)
基本上,我有一个庞大的交易数据库(行)。一组行可能对应于不同的客户(如果df中的列,多行可能具有相同的df.CustomerCard_Num,则为客户卡号。)
我试图用这个lambda函数计算每个客户的行数。但它似乎没有迅速奏效。我应该使用groupby吗?