如何获得pandas系列的元素逻辑NOT?

时间:2013-04-14 10:44:29

标签: python pandas boolean-logic

我有一个包含布尔值的pandas Series对象。如何获得包含每个值的逻辑NOT的系列?

例如,考虑一个包含以下内容的系列:

True
True
True
False

我想要的系列包含:

False
False
False
True

这似乎应该相当简单,但显然我错了我的mojo =(

6 个答案:

答案 0 :(得分:189)

要反转布尔系列,use ~s

In [7]: s = pd.Series([True, True, False, True])

In [8]: ~s
Out[8]: 
0    False
1    False
2     True
3    False
dtype: bool

使用Python2.7,NumPy 1.8.0,Pandas 0.13.1:

In [119]: s = pd.Series([True, True, False, True]*10000)

In [10]:  %timeit np.invert(s)
10000 loops, best of 3: 91.8 µs per loop

In [11]: %timeit ~s
10000 loops, best of 3: 73.5 µs per loop

In [12]: %timeit (-s)
10000 loops, best of 3: 73.5 µs per loop

从Pandas 0.13.0开始,Series不再是numpy.ndarray的子类;它们现在是pd.NDFrame的子类。这可能与np.invert(s)不再像~s-s一样快的原因有关。

警告:timeit结果可能因许多因素而异,包括硬件,编译器,操作系统,Python,NumPy和Pandas版本。

答案 1 :(得分:14)

@ unutbu的回答是现场,只是想添加一个警告,你的面具需要是dtype bool,而不是' object'。也就是说,你的面具不能曾经有任何南方人。见here - 即使你的面具现在是无瑕疵的,它仍将是对象'类型。

'对象的倒数'系列不会抛出错误,相反,你会得到一个不会像你期望的那样工作的整体垃圾掩码。

In[1]: df = pd.DataFrame({'A':[True, False, np.nan], 'B':[True, False, True]})
In[2]: df.dropna(inplace=True)
In[3]: df['A']
Out[3]:
0    True
1   False
Name: A, dtype object
In[4]: ~df['A']
Out[4]:
0   -2
0   -1
Name: A, dtype object

在与同事谈论这个问题后,我有一个解释:看起来大熊猫正在回归到按位运算符:

In [1]: ~True
Out[1]: -2

答案 2 :(得分:11)

我只是试一试:

In [9]: s = Series([True, True, True, False])

In [10]: s
Out[10]: 
0     True
1     True
2     True
3    False

In [11]: -s
Out[11]: 
0    False
1    False
2    False
3     True

答案 3 :(得分:5)

您还可以使用numpy.invert

In [1]: import numpy as np

In [2]: import pandas as pd

In [3]: s = pd.Series([True, True, False, True])

In [4]: np.invert(s)
Out[4]: 
0    False
1    False
2     True
3    False
编辑:性能上的差异出现在Ubuntu 12.04,Python 2.7,NumPy 1.7.0上 - 虽然使用NumPy 1.6.2似乎不存在:

In [5]: %timeit (-s)
10000 loops, best of 3: 26.8 us per loop

In [6]: %timeit np.invert(s)
100000 loops, best of 3: 7.85 us per loop

In [7]: %timeit ~s
10000 loops, best of 3: 27.3 us per loop

答案 4 :(得分:0)

NumPy速度较慢,因为它将输入强制转换为布尔值(因此None和0变为False,其他所有条件变为True)。

import pandas as pd
import numpy as np
s = pd.Series([True, None, False, True])
np.logical_not(s)

给您

0    False
1     True
2     True
3    False
dtype: object

而〜s会崩溃。在大多数情况下,比NumPy更适合使用代字号。

Pandas 0.25,NumPy 1.17

答案 5 :(得分:0)

为支持此处的出色答案,并为了将来方便起见,在某些情况下,您可能希望翻转列中的真值,并使其他值保持不变(例如,nan值)

In[1]: series = pd.Series([True, np.nan, False, np.nan])
In[2]: series = series[series.notna()] #remove nan values
 
In[3]: series # without nan                                            
Out[3]: 
0     True
2    False
dtype: object

# Out[4] expected to be inverse of Out[3], pandas applies bitwise complement 
# operator instead as in `lambda x : (-1*x)-1`

In[4]: ~series
Out[4]: 
0    -2
2    -1
dtype: object

作为简单的非矢量化解决方案,您只需1.检查type2。反布尔

In[1]: series = pd.Series([True, np.nan, False, np.nan])

In[2]: series = series.apply(lambda x : not x if x is bool else x)
Out[2]: 
Out[2]: 
0     True
1      NaN
2    False
3      NaN
dtype: object