标签: python pandas dataframe subset
我想知道更新我正在使用的数据帧的最有效方法是什么 “位置”列有一些我想要过滤掉的位置。我想保留位置只有两个以上的项目(>两行以上)。
答案 0 :(得分:2)
这可能有点令人费解,但它应该完成工作。
获取超过2次出现的所有地点的列表:
counts = df['location'].value_counts() filt = counts[counts > 2]
过滤原始数据,仅提取出现> 2次的位置(keys())
keys()
filt2 = df['location'].isin(filt.keys())
应用过滤器
print(df[filt2])