我有col的df:
date Account invoice category sales
12-01-2019 123 123 exhaust 2200
13-01-2019 124 124 tyres 1300
15-01-2019 234 125 windscreen 4500
16-01-2019 123 134 gearbox 6000
我已经按客户和销售分组了
dfres = df.groupby(['Account'])({'sales': np.sum})
我收到了:
sales
account
123 8200
124 3300
我现在想检索按分组的详细信息过滤的原始df,因此数据集减少了,但我现在的行数与原始数据相同,并且仅保留了销售额的前5%。如何删除不需要的帐户?
我尝试过:
index_list = res.index.tolist()
newdf = df[df.account.isin(index_list)]
非常感谢