如何获得熊猫系列的元素逻辑 NOT?

How can I obtain the element-wise logical NOT of a pandas Series?

提问人:Louis Thibault 提问时间:4/14/2013 最后编辑:smciLouis Thibault 更新时间:10/11/2023 访问量:241741

问:

我有一个包含布尔值的 pandas 对象。如何获取包含每个值的逻辑的序列?SeriesNOT

例如,考虑一个包含以下内容的系列:

True
True
True
False

我想得到的系列将包含:

False
False
False
True

这似乎应该相当简单,但显然我放错了我的魔力 =(

Python Pandas 运算符 逻辑

评论

4赞 LearnOPhile 9/11/2017
重要的是,数据不包含以下答案的类型,因此请使用:object~ df.astype('bool')
1赞 cs95 1/25/2019
我已经在这篇文章中写了所有逻辑运算符。该帖子还包括替代方案。

答:

21赞 herrfz 4/14/2013 #1

我只是试一试:

In [9]: s = Series([True, True, True, False])

In [10]: s
Out[10]: 
0     True
1     True
2     True
3    False

In [11]: -s
Out[11]: 
0    False
1    False
2    False
3     True

评论

0赞 Louis Thibault 4/14/2013
我从字面上尝试了除 !下次我会记住这一点。-
7赞 root 4/14/2013 #2

你也可以使用 numpy.invert

In [1]: import numpy as np

In [2]: import pandas as pd

In [3]: s = pd.Series([True, True, False, True])

In [4]: np.invert(s)
Out[4]: 
0    False
1    False
2     True
3    False

编辑:性能差异出现在 Ubuntu 12.04、Python 2.7、NumPy 1.7.0 上 - 使用 NumPy 1.6.2 似乎不存在:

In [5]: %timeit (-s)
10000 loops, best of 3: 26.8 us per loop

In [6]: %timeit np.invert(s)
100000 loops, best of 3: 7.85 us per loop

In [7]: %timeit ~s
10000 loops, best of 3: 27.3 us per loop

评论

0赞 gaozhidf 4/8/2018
它可能在其他平台上不正确。Win 7,python 3.6.3 numpy 1.13.3,pandas 0.20.3,(-s)最快,(~s)是第二,np.invert(s)是最慢的
413赞 unutbu 4/14/2013 #3

要反转布尔级数,请使用 ~s

In [7]: s = pd.Series([True, True, False, True])

In [8]: ~s
Out[8]: 
0    False
1    False
2     True
3    False
dtype: bool

使用 Python2.7、NumPy 1.8.0、Pandas 0.13.1:

In [119]: s = pd.Series([True, True, False, True]*10000)

In [10]:  %timeit np.invert(s)
10000 loops, best of 3: 91.8 µs per loop

In [11]: %timeit ~s
10000 loops, best of 3: 73.5 µs per loop

In [12]: %timeit (-s)
10000 loops, best of 3: 73.5 µs per loop

从 Pandas 0.13.0 开始,Series 不再是 ;它们现在是 的子类。这可能与为什么不再像 or 一样快有关。numpy.ndarraypd.NDFramenp.invert(s)~s-s

注意:结果可能因许多因素而异,包括硬件、编译器、操作系统、Python、NumPy 和 Pandas 版本。timeit

评论

0赞 Louis Thibault 4/14/2013
适当地指出。除了速度慢得多之外,波浪号和波浪号之间有什么区别?-
1赞 root 4/14/2013
Wierd,我实际上测试了文档中提到的,但它的性能与:S不同tildenp.invert
0赞 unutbu 4/14/2013
@blz:至少在我的Ubuntu机器上,运行NumPy 1.6.2,性能都是一样的。np.invert(s)~s-s
0赞 unutbu 4/14/2013
@root:我不确定为什么我们的时间结果会有这么大的差异,但它肯定会发生。您使用的是什么操作系统和版本的 NumPy?
0赞 root 4/14/2013
同样在 Ubuntu 上,但使用 NumPy 1.7.0...( 执行与 相同。np.bitwise_not(s)np.inverse
71赞 JSharm 3/10/2017 #4

@unutbu的回答是正确的,只是想添加一个警告,说明你的掩码需要是 dtype bool,而不是“object”。也就是说,你的面具不可能有任何 nan's。看这里 - 即使你的面具现在是无楠的,它仍然是“对象”类型。

“对象”系列的反面不会抛出错误,相反,你会得到一个无法按预期工作的整数的垃圾掩码。

In[1]: df = pd.DataFrame({'A':[True, False, np.nan], 'B':[True, False, True]})
In[2]: df.dropna(inplace=True)
In[3]: df['A']
Out[3]:
0    True
1   False
Name: A, dtype object
In[4]: ~df['A']
Out[4]:
0   -2
0   -1
Name: A, dtype object

在与同事讨论过这个问题后,我有一个解释:看起来 pandas 正在恢复为按位运算符:

In [1]: ~True
Out[1]: -2

正如@geher所说,在用 ~ 反转之前,你可以用 astype 将其转换为布尔值

~df['A'].astype(bool)
0    False
1     True
Name: A, dtype: bool
(~df['A']).astype(bool)
0    True
1    True
Name: A, dtype: bool

评论

0赞 geher 2/6/2020
在您的示例中,输出整数掩码可以转换为您想要的布尔级数,例如.astype(bool)~df['A'].astype(bool)
1赞 JSharm 2/6/2020
这是有效的,因为发生在 vs 之前astype(bool)~~df['A'].astype(bool)(~df['A']).astype(bool)
0赞 grofte 2/28/2020 #5

NumPy 速度较慢,因为它将输入转换为布尔值(因此 None 和 0 变为 False,其他所有内容都变为 True)。

import pandas as pd
import numpy as np
s = pd.Series([True, None, False, True])
np.logical_not(s)

给你

0    False
1     True
2     True
3    False
dtype: object

而 ~s 会崩溃。在大多数情况下,波浪号是比 NumPy 更安全的选择。

熊猫 0.25,NumPy 1.17

1赞 Anders Solberg 8/5/2020 #6

为了支持此处的出色答案,并且为了将来的方便,可能存在以下情况:您希望翻转列中的真值,并使其他值保持不变(例如,nan值)

In[1]: series = pd.Series([True, np.nan, False, np.nan])
In[2]: series = series[series.notna()] #remove nan values
 
In[3]: series # without nan                                            
Out[3]: 
0     True
2    False
dtype: object

# Out[4] expected to be inverse of Out[3], pandas applies bitwise complement 
# operator instead as in `lambda x : (-1*x)-1`

In[4]: ~series
Out[4]: 
0    -2
2    -1
dtype: object

作为一个简单的非矢量化解决方案,您可以: 1.检查类型2。反布尔值

In[1]: series = pd.Series([True, np.nan, False, np.nan])

In[2]: series = series.apply(lambda x : not x if x is bool else x)
Out[2]: 
Out[2]: 
0     True
1      NaN
2    False
3      NaN
dtype: object
0赞 Pegasaurus 10/11/2023 #7

如果你的答案有任何种类或类似的东西,我建议你这样做:<NA>np.nan

inverted_series = (1 - original_series).astype('boolean')

它保持您的 na 值并成功反转它。