使用值列表从pandas数据框中选择行

时间:2012-08-23 16:31:12

标签: python pandas dataframe

假设我有以下pandas数据帧:

df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3, 5]})
df

     A   B
0    5   1
1    6   2
2    3   3
3    4   5

我可以根据特定值进行分组:

x = df[df['A'] == 3]
x

     A   B
2    3   3

但是我如何根据值列表进行子集化? - 像这样:

list_of_values = [3,6]

y = df[df['A'] in list_of_values]

3 个答案:

答案 0 :(得分:805)

这确实是how to filter the dataframe rows of pandas by "within"/"in"?的副本,将您的示例的响应翻译为:

In [5]: df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3, 5]})

In [6]: df
Out[6]:
   A  B
0  5  1
1  6  2
2  3  3
3  4  5

In [7]: df[df['A'].isin([3, 6])]
Out[7]:
   A  B
1  6  2
2  3  3

答案 1 :(得分:5)

您可以使用方法query

df.query('A in [6, 3]')

lst = [6, 3]
df.query('A in @lst')

答案 2 :(得分:0)

另一种方法;

df.loc[df.apply(lambda x: x.A in [3,6], axis=1)]

isin 方法不同,这在确定列表是否包含 A 列的函数时特别有用。例如,f(A) = 2*A - 5 作为函数;

df.loc[df.apply(lambda x: 2*x.A-5 in [3,6], axis=1)]

需要注意的是,这种方法比 isin 方法慢。