假设我有以下pandas数据帧:
df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3, 5]})
df
A B
0 5 1
1 6 2
2 3 3
3 4 5
我可以根据特定值进行分组:
x = df[df['A'] == 3]
x
A B
2 3 3
但是我如何根据值列表进行子集化? - 像这样:
list_of_values = [3,6]
y = df[df['A'] in list_of_values]
答案 0 :(得分:805)
这确实是how to filter the dataframe rows of pandas by "within"/"in"?的副本,将您的示例的响应翻译为:
In [5]: df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3, 5]})
In [6]: df
Out[6]:
A B
0 5 1
1 6 2
2 3 3
3 4 5
In [7]: df[df['A'].isin([3, 6])]
Out[7]:
A B
1 6 2
2 3 3
答案 1 :(得分:5)
答案 2 :(得分:0)
另一种方法;
df.loc[df.apply(lambda x: x.A in [3,6], axis=1)]
与 isin 方法不同,这在确定列表是否包含 A
列的函数时特别有用。例如,f(A) = 2*A - 5
作为函数;
df.loc[df.apply(lambda x: 2*x.A-5 in [3,6], axis=1)]
需要注意的是,这种方法比 isin
方法慢。