我正在对6个类的数据集进行分析,基于零。数据集长达数千个项目。
我需要两个类0和0的数据帧。 1表示第一个数据集和3& 5为第二。
我可以得到0& 1很容易就足够了:
mnist_01 = mnist.loc[mnist['class']<= 1]
然而,我不知道如何获得3级和3级课程。 5 ...所以我希望能够做到的是:
mnist_35 = mnist.loc[mnist['class'] == (3 or 5)]
......而不是做:
mnist_3 = mnist.loc[mnist['class'] == 3]
mnist_5 = mnist.loc[mnist['class'] == 5]
mnist_35 = pd.concat([mnist_3,mnist_5],axis=0)
答案 0 :(得分:2)
您可以使用isin
:
mnist = pd.DataFrame({'class': [0, 1, 2, 3, 4, 5],
'val': ['a', 'b', 'c', 'd', 'e', 'f']})
>>> mnist.loc[mnist['class'].isin([3, 5])]
class val
3 3 d
5 5 f
>>> mnist.loc[mnist['class'].isin([0, 1])]
class val
0 0 a
1 1 b