熊猫计算唯一值,然后根据值进行选择

时间:2018-10-21 13:17:15

标签: python pandas dataframe

我可以使用以下方法获取Pandas DataFrame列中唯一项目的数量:

counts = df.groupby(['name']).size()

但是如何创建一个新的数据框,以选择计数> 300的所有行?

我真的很慢:

df_list = []
d = df['name'].value_counts().to_dict()
for k, v in d.items():
    if v >300:
        sub_df = df.loc[df['name'] == k]
        df_list.append(sub_df)
#then append the dataframes in df_list

但是必须有(多种)更好的方法

0 个答案:

没有答案