在 Python 类中支持等价(“相等”)的优雅方式

Elegant ways to support equivalence ("equality") in Python classes

提问人: 提问时间:12/24/2008 最后编辑:4 revs, 2 users 100%gotgenes 更新时间:7/14/2023 访问量:314154

问:

在编写自定义类时,通过 and 运算符允许等效通常很重要。在 Python 中,这是通过分别实现 和 特殊方法来实现的。我发现最简单的方法是以下方法:==!=__eq____ne__

class Foo:
    def __init__(self, item):
        self.item = item

    def __eq__(self, other):
        if isinstance(other, self.__class__):
            return self.__dict__ == other.__dict__
        else:
            return False

    def __ne__(self, other):
        return not self.__eq__(other)

你知道更优雅的方法吗?您知道使用上述比较方法有什么特别的缺点吗?__dict__

注意:需要澄清一下 - 当 和 未定义时,您会发现以下行为:__eq____ne__

>>> a = Foo(1)
>>> b = Foo(1)
>>> a is b
False
>>> a == b
False

也就是说,计算到因为它真的运行,对同一性的测试(即,“对象是同一个对象吗?a == bFalsea is bab

定义 和 后,您会发现此行为(这就是我们所追求的行为):__eq____ne__

>>> a = Foo(1)
>>> b = Foo(1)
>>> a is b
False
>>> a == b
True
Python

评论

8赞 SingleNegationElimination 7/12/2009
+1,因为我不知道 dict 对 == 使用成员相等,我假设它只对相同的对象 dicts 计算它们相等。我想这是显而易见的,因为 Python 具有将对象标识与值比较区分开来的运算符。is
5赞 max 10/4/2010
我认为接受的答案应该被纠正或重新分配给 Algoria 的答案,以便实施严格的类型检查。
2赞 Alex Punnen 12/2/2015
还要确保哈希被覆盖 stackoverflow.com/questions/1608842/...
0赞 John Henckel 5/11/2022
在 2022 年,使用 python3 并使用 @dataclass,一切正常。

答:

9赞 4 revs, 2 users 89%Vasil #1

您不必同时覆盖两者,只能覆盖,但这会影响 ==、!==、<、> 等的结果。__eq____ne____cmp__

is测试对象标识。这意味着当 a 和 b 都持有对同一对象的引用时,a b 将处于 b 状态。在 python 中,你总是在变量中保存对对象的引用,而不是实际对象,所以本质上要使 a 是 b 为真,其中的对象应该位于相同的内存位置。你如何,最重要的是,你为什么要推翻这种行为?isTrue

编辑:我不知道已从 python 3 中删除,因此请避免使用它。__cmp__

评论

0赞 Ed S. 12/24/2008
因为有时你对对象的平等有不同的定义。
0赞 Vasil 12/24/2008
is 运算符为您提供了对象标识的解释器答案,但您仍然可以通过重写 CMP 来表达您对相等的看法
10赞 gotgenes 12/24/2008
在 Python 3 中,“cmp() 函数消失了,不再支持 __cmp__() 特殊方法。is.gd/aeGv
4赞 too much php #2

我认为你要找的两个术语是平等(==)和身份(is)。例如:

>>> a = [1,2,3]
>>> b = [1,2,3]
>>> a == b
True       <-- a and b have values which are equal
>>> a is b
False      <-- a and b are not the same list object

评论

1赞 gotgenes 12/24/2008
也许吧,除了可以创建一个类,该类仅比较两个列表中的前两个项目,如果这些项目相等,则其计算结果为 True。我认为,这是等价,而不是平等。在情商中仍然完全有效。
0赞 gotgenes 12/24/2008
然而,我确实同意,“是”是对身份的考验。
165赞 3 revs, 2 users 94%cdleary #3

你描述的方式是我一直以来的做法。由于它是完全通用的,因此您始终可以将该功能分解为一个 mixin 类,并在需要该功能的类中继承它。

class CommonEqualityMixin(object):

    def __eq__(self, other):
        return (isinstance(other, self.__class__)
            and self.__dict__ == other.__dict__)

    def __ne__(self, other):
        return not self.__eq__(other)

class Foo(CommonEqualityMixin):

    def __init__(self, item):
        self.item = item

评论

6赞 S.Lott 12/24/2008
+1:策略模式,允许在子类中轻松替换。
3赞 nosklo 12/27/2008
isinstance很烂。为什么要检查它?为什么不直接self.__dict__==other.__dict__?
5赞 max 10/4/2010
@nosklo:我不明白。如果来自完全不相关类的两个对象恰好具有相同的属性,该怎么办?
2赞 max 10/7/2010
@nosklo:如果它不是子类,但它只是偶然具有与(键和值)相同的属性,则可能会计算为 ,即使它毫无意义。我错过了什么吗?self__eq__True
11赞 Adam Parkin 5/2/2012
比较的另一个问题是,如果你有一个属性,你不想在相等性的定义中考虑(例如,一个唯一的对象 ID,或者像时间创建的戳这样的元数据)。__dict__
231赞 Algorias #4

您需要注意继承:

>>> class Foo:
    def __eq__(self, other):
        if isinstance(other, self.__class__):
            return self.__dict__ == other.__dict__
        else:
            return False

>>> class Bar(Foo):pass

>>> b = Bar()
>>> f = Foo()
>>> f == b
True
>>> b == f
False

更严格地检查类型,如下所示:

def __eq__(self, other):
    if type(other) is type(self):
        return self.__dict__ == other.__dict__
    return False

除此之外,您的方法将正常工作,这就是特殊方法的用途。

评论

0赞 gotgenes 8/6/2009
这是一个很好的观点。我想值得注意的是,内置类型的子类仍然允许任何方向相等,因此检查它是否是同一类型甚至可能是不可取的。
16赞 max 9/21/2012
如果类型不同,我建议返回 NotImplemented,将比较委托给 rhs。
4赞 gotgenes 5/15/2013
@max比较不一定是左侧 (LHS) 到右侧 (RHS),然后是 RHS 到 LHS;请参阅 stackoverflow.com/a/12984987/38140。不过,按照您的建议返回将始终导致 ,这是所需的行为。NotImplementedsuperclass.__eq__(subclass)
5赞 Dane White 12/3/2013
如果你有大量的成员,并且没有很多对象副本,那么通常最好添加一个初始的身份测试。这避免了更冗长的字典比较,并且在将对象用作字典键时可以节省大量资金。if other is self
3赞 Dane White 12/3/2013
并且不要忘记实施__hash__()
3赞 2 revsmcrute #5

“is”测试将使用内置的“id()”函数测试身份,该函数本质上返回对象的内存地址,因此不会重载。

但是,在测试类的相等性时,您可能希望对测试更严格一点,并且只比较类中的数据属性:

import types

class ComparesNicely(object):

    def __eq__(self, other):
        for key, value in self.__dict__.iteritems():
            if (isinstance(value, types.FunctionType) or 
                    key.startswith("__")):
                continue

            if key not in other.__dict__:
                return False

            if other.__dict__[key] != value:
                return False

         return True

此代码将仅比较类中的非函数数据成员,并跳过通常所需的任何私有内容。对于普通的旧 Python 对象,我有一个基类,它实现了 __init__、__str__、__repr__ 和 __eq__,所以我的 POPO 对象不会承担所有额外(在大多数情况下是相同的)逻辑的负担。

评论

0赞 spenthil 10/4/2010
有点吹毛求疵,但“is”仅在您尚未定义自己的 is_() 成员函数 (2.3+) 时才使用 id() 进行测试。[docs.python.org/library/operator.html]
0赞 mcrute 10/4/2010
我假设“覆盖”实际上是指对操作员模块进行猴子修补。在这种情况下,您的陈述并不完全准确。为了方便起见,提供了运算符模块,重写这些方法不会影响“is”运算符的行为。使用“is”的比较总是使用对象的 id() 进行比较,此行为不能被覆盖。此外,is_成员函数对比较没有影响。
0赞 spenthil 10/4/2010
mcrute - 我说得太早了(而且不正确),你是绝对正确的。
0赞 Wookie88 5/29/2013
这是一个非常好的解决方案,尤其是当 will 被声明时(参见另一个答案)。我发现这在比较SQLAlchemy中从Base派生的类的实例时特别有用。为了不比较,我改成了.我其中也有一些反向引用,Algorias 的答案产生了无休止的递归。因此,我将所有反向引用命名为 开头,以便在比较过程中也跳过它们。注意:在 Python 3.x 中更改为 .__eq__CommonEqualityMixin_sa_instance_statekey.startswith("__")):key.startswith("_")):'_'iteritems()items()
0赞 max 4/13/2015
@mcrute 通常,除非用户定义了实例,否则实例没有任何开头的内容。像 、 等这样的东西不在实例的 中,而是在它的类中。OTOH,私有属性可以很容易地以 开头,并且可能应该用于 .您能澄清一下在跳过前缀属性时您到底想避免什么吗?__dict______class____init____dict____dict______eq____
18赞 3 revs, 2 users 98%John Mee #6

这不是一个直接的答案,但似乎足够相关,因为它有时会节省一些冗长乏味。直接从文档中剪切...


functools.total_ordering(cls)

给定一个类,定义一个或多个丰富的比较排序方法,该类装饰器提供其余部分。这简化了指定所有可能的丰富比较操作所涉及的工作:

该类必须定义 、 、 或 之一。此外,该类应提供方法。__lt__()__le__()__gt__()__ge__()__eq__()

新版本 2.7

@total_ordering
class Student:
    def __eq__(self, other):
        return ((self.lastname.lower(), self.firstname.lower()) ==
                (other.lastname.lower(), other.firstname.lower()))
    def __lt__(self, other):
        return ((self.lastname.lower(), self.firstname.lower()) <
                (other.lastname.lower(), other.firstname.lower()))

评论

2赞 Mr_and_Mrs_D 5/31/2016
然而,total_ordering也有微妙的陷阱:regebro.wordpress.com/2010/12/13/......注意 !
464赞 30 revs, 7 users 56%Tal Weiss #7

考虑这个简单的问题:

class Number:

    def __init__(self, number):
        self.number = number


n1 = Number(1)
n2 = Number(1)

n1 == n2 # False -- oops

因此,Python 默认使用对象标识符进行比较操作:

id(n1) # 140400634555856
id(n2) # 140400634555920

覆盖该函数似乎解决了问题:__eq__

def __eq__(self, other):
    """Overrides the default implementation"""
    if isinstance(other, Number):
        return self.number == other.number
    return False


n1 == n2 # True
n1 != n2 # True in Python 2 -- oops, False in Python 3

Python 2 中,请始终记住覆盖该函数,如文档所述:__ne__

比较运算符之间没有隐含关系。这 的真相并不意味着这是错误的。因此,当 定义,还应该定义,以便 操作员将按预期运行。x==yx!=y__eq__()__ne__()

def __ne__(self, other):
    """Overrides the default implementation (unnecessary in Python 3)"""
    return not self.__eq__(other)


n1 == n2 # True
n1 != n2 # False

Python 3 中,这不再是必需的,正如文档所述:

默认情况下,委托和反转结果 除非是.没有其他暗示 比较运算符之间的关系,例如,真值 的并不意味着 。__ne__()__eq__()NotImplemented(x<y or x==y)x<=y

但这并不能解决我们所有的问题。让我们添加一个子类:

class SubNumber(Number):
    pass


n3 = SubNumber(1)

n1 == n3 # False for classic-style classes -- oops, True for new-style classes
n3 == n1 # True
n1 != n3 # True for classic-style classes -- oops, False for new-style classes
n3 != n1 # False

注意:Python 2 有两种类:

  • 经典样式(或旧样式)类,继承自 ,并且声明为 ,或者 其中是经典样式类;objectclass A:class A():class A(B):B

  • 新样式类,这些类继承自新样式类,并且声明为 WHERE 是新样式类。Python 3 只有声明为 或 的新式类。objectclass A(object)class A(B):Bclass A:class A(object):class A(B):

对于经典样式的类,比较操作始终调用第一个操作数的方法,而对于新样式的类,它始终调用子类操作数的方法,而不考虑操作数的顺序

所以在这里,if 是一个经典风格的类:Number

  • n1 == n3调用n1.__eq__;
  • n3 == n1调用n3.__eq__;
  • n1 != n3调用n1.__ne__;
  • n3 != n1调用。n3.__ne__

如果是一个新样式的类:Number

  • 两者和调用n1 == n3n3 == n1n3.__eq__;
  • 两者都调用 .n1 != n3n3 != n1n3.__ne__

为了修复 Python 2 经典风格类的 and 运算符的非交换性问题,当操作数类型不受支持时,and 方法应返回该值。文档将该值定义为:==!=__eq____ne__NotImplementedNotImplemented

如果出现以下情况,数值方法和丰富的比较方法可能会返回此值 它们不对提供的操作数实现操作。( 然后,解释器将尝试反射操作,或其他一些操作 回退,具体取决于操作员。它的真值是真的。

在这种情况下,运算符将比较操作委托给另一个操作数的反射方法该文档将反射的方法定义为:

这些方法没有交换参数版本(要使用 当 left 参数不支持操作但 right 参数时 论点确实);相反,并且是彼此的 反思,是彼此的反思,也是自己的反思。__lt__()__gt__()__le__()__ge__()__eq__()__ne__()

结果如下所示:

def __eq__(self, other):
    """Overrides the default implementation"""
    if isinstance(other, Number):
        return self.number == other.number
    return NotImplemented

def __ne__(self, other):
    """Overrides the default implementation (unnecessary in Python 3)"""
    x = self.__eq__(other)
    if x is NotImplemented:
        return NotImplemented
    return not x

返回值而不是 of 是正确的做法,即使对于新式类,如果当操作数是不相关的类型(无继承)时,需要 and 运算符的可交换性NotImplementedFalse==!=

我们到了吗?差一点。我们有多少个唯一号码?

len(set([n1, n2, n3])) # 3 -- oops

集合使用对象的哈希值,默认情况下,Python 返回对象标识符的哈希值。让我们尝试覆盖它:

def __hash__(self):
    """Overrides the default implementation"""
    return hash(tuple(sorted(self.__dict__.items())))

len(set([n1, n2, n3])) # 1

最终结果如下所示(我在末尾添加了一些断言以进行验证):

class Number:

    def __init__(self, number):
        self.number = number

    def __eq__(self, other):
        """Overrides the default implementation"""
        if isinstance(other, Number):
            return self.number == other.number
        return NotImplemented

    def __ne__(self, other):
        """Overrides the default implementation (unnecessary in Python 3)"""
        x = self.__eq__(other)
        if x is not NotImplemented:
            return not x
        return NotImplemented

    def __hash__(self):
        """Overrides the default implementation"""
        return hash(tuple(sorted(self.__dict__.items())))


class SubNumber(Number):
    pass


n1 = Number(1)
n2 = Number(1)
n3 = SubNumber(1)
n4 = SubNumber(4)

assert n1 == n2
assert n2 == n1
assert not n1 != n2
assert not n2 != n1

assert n1 == n3
assert n3 == n1
assert not n1 != n3
assert not n3 != n1

assert not n1 == n4
assert not n4 == n1
assert n1 != n4
assert n4 != n1

assert len(set([n1, n2, n3, ])) == 1
assert len(set([n1, n2, n3, n4])) == 2

评论

5赞 max 4/15/2015
hash(tuple(sorted(self.__dict__.items())))如果 的值中有任何不可哈希的对象(即,如果对象的任何属性设置为,例如,一个)。self.__dict__list
3赞 Tal Weiss 4/15/2015
没错,但是如果你的 vars() 中有这样的可变对象,那么这两个对象就不相等了......
14赞 Florian Brucker 6/22/2015
很好的总结,但您应该使用 == 而不是 __eq__ 来实现__ne__
12赞 GregNash 4/4/2019
他问起优雅,但他变得健壮。
2赞 Bin 5/26/2019
n1 == n3甚至应该为经典类吗?因为这种情况应该是并且是正确的?Trueothern3isinstance(n3, Number)
6赞 2 revsAaron Hall #8

从这个答案:https://stackoverflow.com/a/30676267/541136 我已经证明了这一点,虽然用术语定义是正确的 - 而不是__ne____eq__

def __ne__(self, other):
    return not self.__eq__(other)

您应该使用:

def __ne__(self, other):
    return not self == other
2赞 bluenote10 #9

我喜欢使用通用类装饰器,而不是使用子类/mixin

def comparable(cls):
    """ Class decorator providing generic comparison functionality """

    def __eq__(self, other):
        return isinstance(other, self.__class__) and self.__dict__ == other.__dict__

    def __ne__(self, other):
        return not self.__eq__(other)

    cls.__eq__ = __eq__
    cls.__ne__ = __ne__
    return cls

用法:

@comparable
class Number(object):
    def __init__(self, x):
        self.x = x

a = Number(1)
b = Number(1)
assert a == b
2赞 2 revsNoumenon #10

这包含了对 Algoria 答案的评论,并按单个属性比较对象,因为我不关心整个字典。 必须是真的,但我知道这是因为我在构造函数中设置了它。hasattr(other, "id")

def __eq__(self, other):
    if other is self:
        return True

    if type(other) is not type(self):
        # delegate to superclass
        return NotImplemented

    return other.id == self.id
0赞 2 revstyperacer #11

我编写了一个自定义库,其默认实现只是否定:__ne____eq__

class HasEq(object):
  """
  Mixin that provides a default implementation of ``object.__neq__`` using the subclass's implementation of ``object.__eq__``.

  This overcomes Python's deficiency of ``==`` and ``!=`` not being symmetric when overloading comparison operators
  (i.e. ``not x == y`` *does not* imply that ``x != y``), so whenever you implement
  `object.__eq__ <https://docs.python.org/2/reference/datamodel.html#object.__eq__>`_, it is expected that you
  also implement `object.__ne__ <https://docs.python.org/2/reference/datamodel.html#object.__ne__>`_

  NOTE: in Python 3+ this is no longer necessary (see https://docs.python.org/3/reference/datamodel.html#object.__ne__)
  """

  def __ne__(self, other):
    """
    Default implementation of ``object.__ne__(self, other)``, delegating to ``self.__eq__(self, other)``.

    When overriding ``object.__eq__`` in Python, one should also override ``object.__ne__`` to ensure that
    ``not x == y`` is the same as ``x != y``
    (see `object.__eq__ <https://docs.python.org/2/reference/datamodel.html#object.__eq__>`_ spec)

    :return: ``NotImplemented`` if ``self.__eq__(other)`` returns ``NotImplemented``, otherwise ``not self.__eq__(other)``
    """
    equal = self.__eq__(other)
    # the above result could be either True, False, or NotImplemented
    if equal is NotImplemented:
      return NotImplemented
    return not equal

如果从此基类继承,则只需实现 和 基类。__eq__

回想起来,更好的方法可能是将其实现为装饰器。类似于 @functools.total_ordering 的东西

1赞 trincot #12

支持等价的另一种优雅方式是使用 .然后,您的示例将变为:@dataclassFoo

from dataclasses import dataclass

@dataclass
class Foo:
    item: int

就是这样!现在行为如下:

a = Foo(1)
b = Foo(1)
print(a == b)  # True
c = Foo(2)
print(a == c)  # False

如果您的类需要提供其他实例属性,这些属性不应在等价性中发挥作用,则在 中定义它们,如下所示:__post_init__

from dataclasses import dataclass
from random import randint

@dataclass
class Foo:
    age: int
    name: str
    
    def __post_init__(self):
        self.rnd = randint(1, 100000)

a = Foo(38, "Helen")
b = Foo(38, "Helen")
print(a == b)  # True
print(a.rnd == b.rnd)  # False, probably ;-)