我想选择数据框中的列,这些行在列列表的每列中都为零。例如这个df:
In:
df = pd.DataFrame([[1,2,3,6], [2,4,6,8], [0,0,3,4],[1,0,3,4],[0,0,0,0]],columns =['a','b','c','d'])
df
Out:
a b c d
0 1 2 3 6
1 2 4 6 8
2 0 0 3 4
3 1 0 3 4
4 0 0 0 0
然后:
In:
mylist = ['a','b']
selection = df.loc[df['mylist']==0]
selection
我想看看:
Out:
a b c d
2 0 0 3 4
4 0 0 0 0
应该很简单,但我的日子很慢!
答案 0 :(得分:5)
您需要确定行的所有列是否都为零。给定一个布尔掩码,使用DataFrame.all(axis=1)
来做到这一点。
df[df[mylist].eq(0).all(1)]
a b c d
2 0 0 3 4
4 0 0 0 0
请注意,如果要在每列中查找包含零的行,请删除子集步骤:
df[df.eq(0).all(1)]
a b c d
4 0 0 0 0
答案 1 :(得分:1)
使用reduce
和Numpy的logical_and
这样做的目的是消除创建新Pandas对象的需要,并简单地使用它所在的数据生成我们正在寻找的掩码。
from functools import reduce
df[reduce(np.logical_and, (df[c].values == 0 for c in mylist))]
a b c d
2 0 0 3 4
4 0 0 0 0