如何按列值从pandas数据框中选择值

时间:2016-02-05 23:08:50

标签: python pandas

我正在对6个类的数据集进行分析,基于零。数据集长达数千个项目。

我需要两个类0和0的数据帧。 1表示第一个数据集和3& 5为第二。

我可以得到0& 1很容易就足够了:

mnist_01 = mnist.loc[mnist['class']<= 1]

然而,我不知道如何获得3级和3级课程。 5 ...所以我希望能够做到的是:

mnist_35 = mnist.loc[mnist['class'] == (3 or 5)]

......而不是做:

mnist_3 = mnist.loc[mnist['class'] == 3]
mnist_5 = mnist.loc[mnist['class'] == 5]
mnist_35 = pd.concat([mnist_3,mnist_5],axis=0)

1 个答案:

答案 0 :(得分:2)

您可以使用isin

mnist = pd.DataFrame({'class': [0, 1, 2, 3, 4, 5], 
                      'val': ['a', 'b', 'c', 'd', 'e', 'f']})

>>> mnist.loc[mnist['class'].isin([3, 5])]
   class val
3      3   d
5      5   f

>>> mnist.loc[mnist['class'].isin([0, 1])]
   class val
0      0   a
1      1   b