我可以使用以下方法获取Pandas DataFrame列中唯一项目的数量:
counts = df.groupby(['name']).size()
但是如何创建一个新的数据框,以选择计数> 300的所有行?
我真的很慢:
df_list = []
d = df['name'].value_counts().to_dict()
for k, v in d.items():
if v >300:
sub_df = df.loc[df['name'] == k]
df_list.append(sub_df)
#then append the dataframes in df_list
但是必须有(多种)更好的方法