是否可以在没有 epsilon 的情况下将浮点数与 0.0 进行比较?

Is it ok to compare floating points to 0.0 without epsilon?

提问人:463035818_is_not_an_ai 提问时间:8/24/2016 最后编辑:Clifford463035818_is_not_an_ai 更新时间:4/6/2019 访问量:11642

问:

我知道,要比较两个浮点值,需要使用一些 epsilon 精度,因为它们并不准确。但是,我想知道是否有边缘情况,我不需要那个 epsilon。

特别是,我想知道做这样的事情是否总是安全的:

double foo(double x){
    if (x < 0.0) return 0.0;
    else return somethingelse(x); // somethingelse(x) != 0.0
}

int main(){
   int x = -3.0;
   if (foo(x) == 0.0) { 
     std::cout << "^- is this comparison ok?" << std::endl; 
   }
}

我知道有更好的编写方法(例如,另外返回一个标志),但我想知道一般来说是否可以分配给浮点变量,然后将其与 进行比较。foo0.00.0

或者更一般地说,下面的比较是否总是正确的?

double x = 3.3;
double y = 3.3;
if (x == y) { std::cout << "is an epsilon required here?" << std::endl; }

当我尝试它时,它似乎有效,但可能人们不应该依赖它。

C++ 浮点 相等

评论

1赞 Oliver Charlesworth 8/24/2016
为什么你认为这在这方面很特别?0.0
6赞 463035818_is_not_an_ai 8/24/2016
@OliverCharlesworth因为如果 0.0 不能用浮点精确表示,我会感到惊讶
10赞 Kerrek SB 8/24/2016
你的前提错了。比较浮点数是完全可能和明智的。它不是不精确的类型,它只是不精确的操作
2赞 Johannes Schaub - litb 8/24/2016
为什么不呢?作为以 2 为基数的数字,确切值可能不同,但肯定以相同的方式不同。我想说,这些必须相等。3.33.3
1赞 Ben Voigt 8/24/2016
@tobi303:您可能也对以下产品感兴趣: stackoverflow.com/q/21416022/103167

答:

8赞 Pete Becker 8/24/2016 #1

是的,如果你回来,你可以把它比作;0 可以精确地表示为浮点值。如果你返回,你必须更加小心,因为它不能完全表示,所以例如,从 double 到 float 的转换将产生不同的值。0.00.03.33.3

评论

2赞 David Schwartz 8/24/2016
问题不在于零是否可精确表示,而在于它是否唯一可表示。
6赞 Johannes Schaub - litb 8/24/2016
@DavidSchwartz我不认为这是问题所在。但问题是两个零的比较是否正确。即使两个零的表示方式不同,也可能会出现这种情况。
2赞 Clifford 8/24/2016
如果您要比较零的值是计算的结果,那么是完全可表示的,这根本没有帮助。因此,虽然在所示的具体示例中是安全的,但它通常并不安全。
1赞 Pete Becker 8/24/2016
@DavidSchwartz - 它表明没有浮点行为是可以保证的,也不可能保证。既然你没有绝对,你(倒吸一口凉气!)必须对合理性做出假设。
2赞 David Schwartz 8/24/2016
@PeteBecker 对不起,我不同意。你有标准,比如 C++ 标准。问这个标准保证什么和不保证什么是完全合理的。
11赞 alain 8/24/2016 #2

是的,在此示例中,检查 是完全可以的。这并不是因为在任何方面都很特别,而是因为你只分配一个值,然后进行比较。您也可以将其设置为并比较,这也很好。您正在存储一个位模式,并比较完全相同的位模式,只要这些值没有被提升为另一种类型来进行比较。== 0.00.03.3== 3.3

但是,在数学上等于零的计算结果并不总是等于 。0.0


此问答已发展到还包括由不同编译器编译程序的不同部分的情况。这个问题没有提到这一点,我的答案仅适用于所有相关部分使用相同的编译器时。

C++ 11 标准,
§5.10 相等运算符

6 如果两个操作数都是算术或枚举类型,则通常 在两个操作数上执行算术转换;每个 如果指定的关系为 true,则运算符应产生 true,并且 如果为 false,则为 false。

这种关系没有进一步定义,因此我们必须使用“平等”的共同含义。

§2.13.4 浮动文字

1 [...]如果缩放值在可表示值的范围内 对于其类型,结果是缩放值(如果可表示),否则 最接近缩放值的更大或更小的可表示值, 以实现定义的方式选择。[...]

当值不可表示时,编译器在转换文本时必须在两个值之间进行选择。如果始终如一地为同一文本选择相同的值,则可以安全地比较诸如 等值,因为表示“相等”。3.3==

评论

0赞 David Schwartz 8/24/2016
你有什么保证只有一种位模式表示?如果有两个同样好的位模式表示,比如说,如果从内存加载,则得到另一个,如果直接将零加载到内部浮点单元中,则会得到该怎么办?0.00.0
2赞 Eric Leschinski 8/24/2016
你错了,0.0 以一种非常独特的方式很特别。这就是为什么你可以用它做一些你用浮子做不到的事情。
3赞 David Schwartz 8/24/2016
@EricLeschinski 你有这个说法的参考吗?
2赞 Mats Petersson 8/24/2016
这实际上不是 0.0 是否可以只用一个位模式表示的问题,而是相关浮点标准对比较浮点数的看法。如今,很难找到一台不遵循 IEEE-754 或其近似衍生品的机器,并且保证将 +0.0 与 -0.0 进行比较将给出“相等”。当然,如果你执行类似 的操作,那么你必须确保位模式匹配。y = foo(x); z = 0.0; if (memcmp(&y, &z, sizeof(z)) == 0) { it_is_zero(); }
2赞 Eric Leschinski 8/24/2016
0.0 的特殊之处在于它没有十进制或二进制的重复尾数。还有其他特殊的浮点值,它们具有在十进制及其转换后的二进制中在 17 个单位精度之前终止尾数的这些属性。浮点比较的危险在于从十进制到二进制的转换,而不是双等分部分。参考:youtube.com/watch?v=PZRI1IfStY0 零的特殊性在于尾数是否在十进制到二进制转换器切掉其余部分之前终止。在第二次阅读你的答案时。你没有错。
2赞 example 8/24/2016 #3

更正:因为浮点值不是唯一的,但 IEEE 754 将比较定义为 true(任何零)。00.0==-0.0

因此,对于其他所有数字,它都不起作用。一个编译单元(例如库)和另一个编译单元(例如您的应用程序)中的文本可能不同。该标准仅要求编译器使用与运行时相同的舍入,但不同的编译器/编译器设置可能使用不同的舍入。0.03.3

它大部分时间都会起作用(对于 0),但这是非常糟糕的做法。

只要您使用具有相同设置(例如一个编译单元)的相同编译器,它就会起作用,因为文字 or 每次都会转换为相同的位模式。不过,零的表示并不是唯一的。因此,如果在库中声明,并且在某些应用程序中调用它,则同一函数可能会失败。0.00.0ffoo

您可以通过使用 std::fpclassify 检查返回的值是否表示零来挽救这种情况。对于每个有限(非零)值,除非您停留在一个编译单元内并且不对值执行任何操作,否则您将不得不使用 epsilon-comparison。

评论

0赞 example 8/24/2016
嗯,这里学到了一些新东西=)我一直认为浮点比较基本上是逐字节比较,但显然我错了。
1赞 old_timer 8/24/2016 #4

正如在这两种情况下所写的,您在提供给同一编译器的同一文件中使用相同的常量。编译器使用的字符串到浮点数转换应返回相同的位模式,因此这些位模式不仅应该像零事物的正负情况那样相等,而且应该逐位相等。

如果你有一个常量,它使用操作系统 C 库来生成位模式,那么有一个字符串到 f 或如果二进制文件被传输到另一台计算机而不是编译的计算机,它可能会使用不同的 C 库。您可能有问题。

当然,如果您为其中一个术语 Runtime 计算 3.3,并再次计算另一个 3.3 编译时间,则可以并且将在相等的比较中失败。某些常量显然比其他常量更有可能起作用。

当然,正如所写的那样,你的 3.3 比较是死代码,如果启用了优化,编译器就会删除它。

您没有指定浮点格式,也没有指定您感兴趣的格式的标准(如果有)。例如,有些格式有 +/- 零问题,有些则没有。

1赞 aparpara 4/6/2019 #5

一个常见的误解是浮点值“不准确”。事实上,它们中的每一个都是完全精确的(除了一些特殊情况,如 -0.0 或 Inf)并且等于 s·2 e –(p – 1),其中 sep 分别是有效、指数和精度,它们中的每一个都是整数。E.g. in IEEE 754-2008 binary32 format (aka float32) p = 24 and 1 is represented as ‭0x‭800000‬‬·20 – 23.在处理浮点值时,有两件事确实不准确:

  1. 使用 FP 表示实际值。显然,并非所有实数都可以使用给定的 FP 格式表示,因此必须以某种方式对它们进行舍入。有几种舍入模式,但最常用的是“舍入到最近,并列到偶数”。如果您始终使用相同的舍入模式(几乎可以肯定是这种情况),则始终使用相同的 FP 表示相同的实际值。因此,您可以确定,如果两个实数值相等,则它们的 FP 对应项也完全相等(但显然不是相反)。
  2. FP 编号的操作(大部分)不准确。因此,如果你在计算机中实现了一些实值函数 φξ) 作为 FP 参数 fx) 的函数,并且你想将其结果与某个“真实”值 y 进行比较,你需要使用一些ε进行比较,因为要精确地给出 y 的函数是非常困难的(有时甚至是不可能的)。ε的值很大程度上取决于所涉及的 FP 操作的性质,因此在每种特定情况下,可能有不同的最佳值。

有关详细信息,请参阅 D. Goldberg。每个计算机科学家都应该了解的关于浮点运算和 J.-M.Muller等人。浮点运算手册。你可以在互联网上找到这两个文本。