根据Pandas

时间:2015-04-23 18:58:26

标签: python pandas dataframe

我有以下DataFrame,我需要分别在[f1,f2,f3,f4,f5]字段中选择[1,2,3,4,5]的数据。

ID  f1  f2  f3  f4  f5
1   1   2   3   4   5
2   2   3   4   5   6
3   1   2   3   4   5
4   5   4   2   3   4


df = DataFrame(numpy.array([[1, 1, 2, 3, 4, 5],
                            [2, 2, 3, 4, 5, 6],
                            [3, 1, 2, 3, 4, 5],
                            [4, 5, 4, 2, 3, 4]], dtype=int64), 
               columns = ['ID','f1','f2','f3','f4','f5'])

一种显而易见的方法是执行以下操作:

df[(df['f1'] == 1) & (df['f2'] == 2) & (df['f3'] == 3) & (df['f4'] == 4) & (df['f5'] == 5)]

有没有简洁的方法来做到这一点?我需要多次执行此操作,并且某些其他DataFrame的字段名称可能不同。

1 个答案:

答案 0 :(得分:4)

一种稍微简单的方法可能是:

>>> df[(df.loc[:, 'f1':'f5'] == np.arange(1, 6)).all(1)]
   ID  f1  f2  f3  f4  f5
0   1   1   2   3   4   5
2   3   1   2   3   4   5

此处df.loc[:, 'f1':'f5']选择列,并对这些列进行测试(逐行)以确保与数组[1, 2, 3, 4, 5]相等。