过滤列的子集数据框

时间:2017-06-19 18:28:28

标签: python pandas dataframe subset

我想知道更新我正在使用的数据帧的最有效方法是什么 “位置”列有一些我想要过滤掉的位置。我想保留位置只有两个以上的项目(>两行以上)。 head and tail of df snapshot of unique locations

1 个答案:

答案 0 :(得分:2)

这可能有点令人费解,但它应该完成工作。

获取超过2次出现的所有地点的列表:

counts = df['location'].value_counts()
filt = counts[counts > 2]

过滤原始数据,仅提取出现> 2次的位置(keys()

filt2 = df['location'].isin(filt.keys())

应用过滤器

print(df[filt2])