我正在尝试从不同发行商处获取每部电影的总计,然后将这些总计转换为所有发行商总计总计的百分比。然后,我需要拿出所有不足1%的分销商,然后将所有分销商合并为另一个分销商,称为other。
有100多个分销商,总计销售总额,并为每个分销创建百分比而不是销售数量。 这是下面的代码的输出。
print(df.groupby(df['Distributor'])['Tickets Sold'].sum())
Distributor
20th Century Fox 141367982
25th Frame 2989
26 Aries 867
A24 6494901
Abramorama Films 367311
Anchor Bay Entertainment 12710
Archstone Entertainment 1299
Area 23a 4615
ArtAffects 48549
ArtMattan Productions 319
答案 0 :(得分:1)
通过将sum
的{{1}}与Series.lt
进行比较来创建布尔掩码,通过boolean indexing
通过倒置掩码过滤,并通过setting with enlargement和{{1 }} <
下的已过滤行:
sum