如何检查 NaN 值-解网

问：

float('nan')表示 NaN（不是数字）。但是我该如何检查呢？

Python 数学 nan

31赞 Craig McQueen 1/22/2010

有关 Python 中 NaN 的一些历史，请参阅 PEP 754。python.org/dev/peps/pep-0754

4赞 Michał Šrajer 2/5/2023

只是为了好玩，NaN 是一个数字：;-Pisinstance(float("nan"), Number)

答：

598赞 C. K. Young 6/3/2009 #1

测试 NaN 的常用方法是查看它是否等于自身：

def isNaN(num):
    return num != num

10赞 mavnn 1/26/2010

警告词：引用 Bear 在下面的评论“对于坚持使用 python <= 2.5 的人。Nan ！= Nan 工作不可靠。改用numpy。话虽如此，我实际上从未见过它失败。

49赞 djsadinoff 8/12/2011

我敢肯定，考虑到运算符重载，我有很多方法可以混淆这个函数。使用 math.isnan（）

9赞 Hari Ganesan 4/2/2014

在上面提到的 754 规范中，它说 NaN==NaN 应该始终为 false，尽管它并不总是这样实现。这是不可能的，这就是数学和/或numpy在引擎盖下检查它的方式吗？

61赞 Gonzalo 10/17/2019

尽管这有效，而且在某种程度上是有道理的，但我是一个有原则的人，我特此宣布这是被禁止的巫术。请改用 math.isnan。

10赞 Tobias Geisler 6/28/2020

如果您的输入包含字符串，则这是正确答案。（@williamtorkington）并且在这种情况下都会中断。np.isnanmath.isnan

2066赞 gimel 6/3/2009 #2

使用 math.isnan：

>>> import math
>>> x = float('nan')
>>> math.isnan(x)
True

12赞 gimel 9/8/2016

@charlie-parker ：在 Python3 中，math.isnan 仍然是 math 模块的一部分。docs.python.org/3/library/math.html#math.isnan .如果您愿意，请使用 numpy.isnan，此答案只是一个建议。

84赞 TMWP 8/1/2017

是首选？math.isnannp.isnan()

90赞 petrpulc 9/12/2017

@TMWP可能...... 大约需要 15 MB 的 RAM，而需要大约 0,2 MBimport numpyimport math

40赞 user2357112 2/21/2019

@TMWP：如果您使用的是 NumPy，则是一个更好的选择，因为它可以处理 NumPy 数组。如果你不使用 NumPy，那么获取 NumPy 依赖项并花时间加载 NumPy 只是为了 NaN 检查是没有好处的（但如果你正在编写执行 NaN 检查的代码，那么你可能应该使用 NumPy）。numpy.isnan

11赞 Mike 7/11/2019

@jungwook 这实际上行不通。你的表达总是假的。也就是说，返回——这是一个奇怪的约定，但基本上是 NaN 定义的一部分。你想要的方法实际上是下面Chris Jester-Young发布的方法。float('nan') == float('nan')False

28赞 Tomalak 6/3/2009 #3

math.isnan（）

或将数字与自身进行比较。NaN 始终是！= NaN，否则（例如，如果它是一个数字）比较应该成功。

6赞 Bear 1/18/2010

对于坚持使用 python 的人来说，<= 2.5。Nan ！= Nan 工作不可靠。改用numpy。

281赞 mavnn 6/3/2009 #4

numpy.isnan(number)告诉你是不是。NaN

3赞 Michel Keijzers 12/5/2012

也适用于 python 2.7 版。

14赞 Jay Prall 2/28/2014

numpy.all(numpy.isnan(data_list))如果您需要确定列表中的所有元素是否都是 nan，也很有用

6赞 sleblanc 3/28/2015

不需要 NumPy：all(map(math.isnan, [float("nan")]*5))

8赞 mavnn 3/30/2015

当这个答案在 6 年前写成时，Python 2.5 仍在普遍使用 - math.isnan 不是标准库的一部分。现在，我真的希望很多地方不是这样！

5赞 comte 5/16/2018

请注意，np.isnan（）不处理十进制。十进制类型（与许多numpy的函数一样）。math.isnan（）处理。

17赞 Josh Lee 1/26/2010 #5

如果您卡在 <2.6 上，您没有 numpy，并且没有 IEEE 754 支持，则使用另一种方法：

def isNaN(x):
    return str(x) == str(1e400*0)

10赞 Mauro Bianchi 6/17/2010 #6

使用 python < 2.6，我最终得到了

def isNaN(x):
    return str(float(x)).lower() == 'nan'

这适用于Solaris 5.9机器上的python 2.5.1和Ubuntu 2.6.5上的python 10

6赞 Mike T 2/1/2012

这不太便携，因为 Windows 有时称之为-1.#IND

27赞 Idok 7/5/2012 #7

好吧，我输入了这篇文章，因为我在该功能上遇到了一些问题：

math.isnan()

运行此代码时出现问题：

a = "hello"
math.isnan(a)

它引发了异常。我的解决方案是再做一次检查：

def is_nan(x):
    return isinstance(x, float) and math.isnan(x)

5赞 Peter Hansen 7/7/2013

它可能被否决了，因为 isnan（）接受浮点数，而不是字符串。这个功能没有错，问题只在于他尝试使用它。（对于那个特定的用例，他的解决方案是有效的，但它不是这个问题的答案。

7赞 Rob 3/24/2014

以这种方式检查类型时要小心。例如，对于numpy.float32 NaN，这将不起作用。最好使用 try/except 结构：def is_nan(x): try: return math.isnan(x) except: return False

4赞 Brice M. Dempsey 7/17/2015

NaN 并不意味着值不是有效数字。它是IEEE浮点表示的一部分，用于指定特定结果未定义。例如 0 / 0。因此，问“你好”是否是楠是没有意义的。

2赞 RAFIQ 3/11/2016

这更好，因为 NaN 可以进入任何字符串、整数或浮点数列表，因此检查很有用

0赞 Cristian Garcia 6/5/2020

我必须实现这一点来处理 pandas 中的字符串列。

33赞 DaveTheScientist 9/26/2012 #8

我实际上只是遇到了这个问题，但对我来说，它正在检查 nan、-inf 或 inf。我刚刚用过

if float('-inf') < float(num) < float('inf'):

对于数字来说，这是真的，对于 nan 和 inf 来说都是 false，并且会为字符串或其他类型等内容引发异常（这可能是一件好事）。此外，这不需要导入任何库，如 math 或 numpy（numpy 太大了，它的大小是任何编译应用程序的两倍）。

12赞 sudo_coffee 11/23/2016

math.isfinite直到 Python 3.2 才被引入，所以鉴于 2012 年发布的@DaveTheScientist的答案，它并不完全是“重新发明轮子”——解决方案仍然代表那些使用 Python 2 的人。

0赞 Derek O 5/25/2021

这对于需要检查表达式中 NaN 的用户很有用。例如将返回pd.evalpd.eval(float('-inf') < float('nan') < float('inf'))False

7赞 Mahdi 6/23/2016 #9

我正在从以字符串形式发送的 Web 服务接收数据。但是我的数据中也可能有其他类型的字符串，所以一个简单的字符串可能会引发异常。我使用了接受答案的以下变体：NaN'Nan'float(value)

def isnan(value):
  try:
      import math
      return math.isnan(float(value))
  except:
      return False

要求：

isnan('hello') == False
isnan('NaN') == True
isnan(100) == False
isnan(float('nan')) = True

1赞 chwi 7/6/2016

或try: int(value)

0赞 Mahdi 7/6/2016

@chwi那么，你的建议说明了存在与否吗？valueNaN

0赞 chwi 7/7/2016

好吧，由于“不是一个数字”，任何不能转换为 int 的东西我猜实际上都不是数字，并且 try 语句会失败吗？尝试，返回 true，但返回 false。

0赞 Mahdi 7/7/2016

@chwi 好吧，从字面上理解“不是一个数字”，你是对的，但这不是重点。事实上，我正在寻找的正是语义是什么（就像在 python 中你可以得到什么一样），因此虽然字符串“Hello”不是一个数字，但它也不是，因为它仍然是一个数值！NaNfloat('inf') * 0NaNNaN

0赞 Harsha Biyani 1/15/2020

@chwi：如果异常处理是针对特定异常的，那么您是正确的。但在这个答案中，已经处理了通用异常。所以没有必要检查所有异常，都会写出来。int(value)False

4赞 siberiawolf61 12/7/2016 #10

判断变量是 NaN 还是 None 的所有方法：

无类型

In [1]: from numpy import math

In [2]: a = None
In [3]: not a
Out[3]: True

In [4]: len(a or ()) == 0
Out[4]: True

In [5]: a == None
Out[5]: True

In [6]: a is None
Out[6]: True

In [7]: a != a
Out[7]: False

In [9]: math.isnan(a)
Traceback (most recent call last):
  File "<ipython-input-9-6d4d8c26d370>", line 1, in <module>
    math.isnan(a)
TypeError: a float is required

In [10]: len(a) == 0
Traceback (most recent call last):
  File "<ipython-input-10-65b72372873e>", line 1, in <module>
    len(a) == 0
TypeError: object of type 'NoneType' has no len()

NaN型

In [11]: b = float('nan')
In [12]: b
Out[12]: nan

In [13]: not b
Out[13]: False

In [14]: b != b
Out[14]: True

In [15]: math.isnan(b)
Out[15]: True

49赞 x0s 5/24/2017 #11

以下是使用以下方法的答案：

符合 IEEE 754 标准的 NaN 实现
- 即：python 的 NaN：， ...float('nan')numpy.nan
任何其他对象：字符串或其他对象（如果遇到，不会引发异常）

按照该标准实现的 NaN 是与其自身的不等式比较应返回 True 的唯一值：

def is_nan(x):
    return (x != x)

还有一些例子：

import numpy as np
values = [float('nan'), np.nan, 55, "string", lambda x : x]
for value in values:
    print(f"{repr(value):<8} : {is_nan(value)}")

输出：

nan      : True
nan      : True
55       : False
'string' : False
<function <lambda> at 0x000000000927BF28> : False

1赞 keithpjolley 11/4/2018

我正在检查的系列是缺少值的字符串是“nans”（???），因此此解决方案适用于其他解决方案失败的地方。

0赞 user2357112 4/14/2020

numpy.nan是一个常规的 Python 对象，就像返回的 kind 一样。您在 NumPy 中遇到的大多数 NaN 都不会是对象。floatfloat('nan')numpy.nan

0赞 x0s 4/22/2020

numpy.nan在 C 的底层库中自行定义其 NaN 值。它不包装 python 的 NaN。但现在，它们都符合 IEEE 754 标准，因为它们依赖于 C99 API。

0赞 x0s 4/22/2020

@user2357112supportsMonica：Python 和 numpy NaN 实际上的行为方式并不相同：（非唯一）和（唯一）float('nan') is float('nan')np.nan is np.nan

1赞 user2357112 4/22/2020

@x0s：这与NumPy无关。是一个特定的对象，而每次调用都会生成一个新对象。如果你这样做了，那么你也会得到。如果你用类似的东西构造了一个实际的 NumPy NaN，那么你会得到 np.float64（'nan'）也不是 np.float64（'nan'）。np.nanfloat('nan')nan = float('nan')nan is nannp.float64('nan')

1赞 J11 7/17/2018 #12

对于 float 类型的 nan

>>> import pandas as pd
>>> value = float(nan)
>>> type(value)
>>> <class 'float'>
>>> pd.isnull(value)
True
>>>
>>> value = 'nan'
>>> type(value)
>>> <class 'str'>
>>> pd.isnull(value)
False

-5赞 Max Kleiner 7/17/2018 #13

对于 panda 中的字符串，取 pd.isnull：

if not pd.isnull(atext):
  for word in nltk.word_tokenize(atext):

作为 NLTK 特征提取的函数

def act_features(atext):
features = {}
if not pd.isnull(atext):
  for word in nltk.word_tokenize(atext):
    if word not in default_stopwords:
      features['cont({})'.format(word.lower())]=True
return features

0赞 Max Kleiner 8/7/2018

这种减少是什么？

0赞 4/20/2020

isnull 不仅为 NaN 值返回 true。

4赞 sleblanc 1/28/2019 #14

如何从混合数据类型列表中删除 NaN（浮点）项

如果在可迭代对象中有混合类型，则以下为不使用 numpy 的解决方案：

from math import isnan

Z = ['a','b', float('NaN'), 'd', float('1.1024')]

[x for x in Z if not (
                      type(x) == float # let's drop all float values…
                      and isnan(x) # … but only if they are nan
                      )]

['a', 'b', 'd', 1.1024]

短路评估意味着不会对非“浮点”类型的值调用，因为无需评估右侧即可快速评估。isnanFalse and (…)False

238赞 M. Hamza Rajput 3/3/2019 #15

这里有三种方法可以测试变量是否为“NaN”。

import pandas as pd
import numpy as np
import math

# For single variable all three libraries return single boolean
x1 = float("nan")

print(f"It's pd.isna: {pd.isna(x1)}")
print(f"It's np.isnan: {np.isnan(x1)}}")
print(f"It's math.isnan: {math.isnan(x1)}}")

输出：

It's pd.isna: True
It's np.isnan: True
It's math.isnan: True

20赞 abhishake 10/16/2019

pd.isna（value）省去了很多麻烦！像魅力一样工作！

4赞 mah65 4/13/2021

pd.isnan()或？这就是问题:Dpd.isna()

4赞 jemand771 5/20/2021

这个答案的第 3 版是正确的，格式很好。这个（现在是 7 个）又错了。回滚为“不想要您的编辑”，而编辑改进了答案 WTF。

2赞 Cam 10/22/2021

旁注：我发现非常有用。if not np.isnan(x):

4赞 wisbucky 10/1/2022

pd.isna('foo')也是唯一可以处理字符串的。并将导致 TypeError 异常。np.isnan('foo')math.isnan('foo')

4赞 Valentin Goikhman 1/14/2020 #16

在 Python 3.6 中，检查字符串值 x math.isnan（x）和 np.isnan（x）会引发错误。因此，如果我事先不知道它是一个数字，我无法检查给定的值是否为 NaN。以下似乎可以解决这个问题

if str(x)=='nan' and type(x)!='str':
    print ('NaN')
else:
    print ('non NaN')

59赞 Grzegorz 6/3/2020 #17

检查它是否等于自身（x ！= x）似乎是最快的。

import pandas as pd 
import numpy as np 
import math 

x = float('nan')

%timeit x != x
44.8 ns ± 0.152 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

%timeit math.isnan(x)
94.2 ns ± 0.955 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

%timeit pd.isna(x)
281 ns ± 5.48 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

%timeit np.isnan(x)
1.38 µs ± 15.7 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

1赞 npengra317 10/31/2020

值得注意的是，即使存在无穷大问题，这也有效。也就是说，如果的计算结果为 false。z = float('inf')z != z

1赞 matan h 12/10/2020

在我的电脑中，然后给出 True。然后给出 False。z=float('inf')z==zx=float('nan')x==x

3赞 rvf 1/4/2022

在大多数（如果不是全部）情况下，这些速度差异只有在重复多次时才有意义。然后，无论如何，您将使用或其他张量库。numpy

1赞 wjandrea 4/3/2023

这是一个糟糕的比较。在此比例（纳秒）下，名称和属性查找时间非常重要。如果仅使用本地名称，则和之间的差异将消失;它们在我的系统上都是大约 35 ns。您可以在单元格模式下使用以下工具检查：1） <换行符> 2） <换行符>x != xmath.isnan(x)%timeit%%timeit x = float('nan')x != x%%timeit x = float('nan'); from math import isnanisnan(x)

0赞 MisterMiyagi 4/3/2023

注意：这些计时仅代表检查预先存在的变量，不能很好地泛化。当实际需要某个函数并且需要包装在 .当应用于需要迭代的数组时，诸如之类的功能将具有非常不同的竞争性。math.isnanx != xlambdanumpynumpy.isnannumpyx != x

9赞 Erfan 6/29/2021 #18

比较，以及它们处理不同类型对象的灵活性。pd.isnamath.isnannp.isnan

下表显示了是否可以使用给定的方法检查对象类型：


+------------+-----+---------+------+--------+------+
|   Method   | NaN | numeric | None | string | list |
+------------+-----+---------+------+--------+------+
| pd.isna    | yes | yes     | yes  | yes    | yes  |
| math.isnan | yes | yes     | no   | no     | no   |
| np.isnan   | yes | yes     | no   | no     | yes  | <-- # will error on mixed type list
+------------+-----+---------+------+--------+------+

`pd.isna`

检查不同类型的缺失值的最灵活方法。

没有一个答案涵盖的灵活性。虽然和将返回值，但您无法检查不同类型的对象，例如或字符串。这两种方法都会返回错误，因此检查混合类型的列表会很麻烦。这虽然是灵活的，并且会为不同类型的类型返回正确的布尔值：pd.isnamath.isnannp.isnanTrueNaNNonepd.isna

In [1]: import pandas as pd

In [2]: import numpy as np

In [3]: missing_values = [3, None, np.NaN, pd.NA, pd.NaT, '10']

In [4]: pd.isna(missing_values)
Out[4]: array([False,  True,  True,  True,  True, False])

0赞 turbonate 3/23/2023

这！！！！我来到这里试图弄清楚如何检查 NaN 和 None，根据用户输入的 excel 工作表，我可以得到它们。如果不是那些讨厌的用户，这将很容易！

0赞 cottontail 7/14/2023 #19

如果要检查非 NaN 的值，则否定用于标记 NaN 的任何值;pandas 有自己的专用函数来标记非 NaN 值。

lst = [1, 2, float('nan')]

m1 = [e == e for e in lst]              # [True, True, False]

m2 = [not math.isnan(e) for e in lst]   # [True, True, False]

m3 = ~np.isnan(lst)                     # array([ True,  True, False])

m4 = pd.notna(lst)                      # array([ True,  True, False])

如果要筛选非 NaN 的值，这将特别有用。对于 ndarray/Series 对象，是矢量化的，因此也可以使用它。==

s = pd.Series(lst)
arr = np.array(lst)

x = s[s.notna()]
y = s[s==s]                             # `==` is vectorized
z = arr[~np.isnan(arr)]                 # array([1., 2.])

assert (x == y).all() and (x == z).all()

上一个：Groupby with agg 和基于行的条件

下一个：在 Python 中解决 JSON null 值

如何检查 NaN 值

How to check for NaN values

评论

评论

评论

评论

评论

评论

评论

评论

评论

评论

评论

评论

评论

pd.isna

评论

`pd.isna`