选择列中只有零的行

时间:2018-05-29 04:47:32

标签: python pandas dataframe

我想选择数据框中的列,这些行在列列表的每列中都为零。例如这个df:

In: 
    df = pd.DataFrame([[1,2,3,6], [2,4,6,8], [0,0,3,4],[1,0,3,4],[0,0,0,0]],columns =['a','b','c','d'])
    df

Out:
    a   b   c   d
0   1   2   3   6
1   2   4   6   8
2   0   0   3   4
3   1   0   3   4
4   0   0   0   0

然后:

In:
    mylist = ['a','b']
    selection = df.loc[df['mylist']==0]
    selection

我想看看:

Out:      
    a   b   c   d
2   0   0   3   4
4   0   0   0   0

应该很简单,但我的日子很慢!

2 个答案:

答案 0 :(得分:5)

您需要确定行的所有列是否都为零。给定一个布尔掩码,使用DataFrame.all(axis=1)来做到这一点。

df[df[mylist].eq(0).all(1)]

   a  b  c  d
2  0  0  3  4
4  0  0  0  0

请注意,如果要在每列中查找包含零的行,请删除子集步骤:

df[df.eq(0).all(1)]

   a  b  c  d
4  0  0  0  0

答案 1 :(得分:1)

使用reduce和Numpy的logical_and
这样做的目的是消除创建新Pandas对象的需要,并简单地使用它所在的数据生成我们正在寻找的掩码。

from functools import reduce

df[reduce(np.logical_and, (df[c].values == 0 for c in mylist))]

   a  b  c  d
2  0  0  3  4
4  0  0  0  0