2套联盟不包含所有物品

时间:2017-06-11 23:29:48

标签: python python-3.x set equivalence-classes

为什么我在下面的工会中改变两组的顺序时,我会得到不同的结果?

set1 = {1, 2, 3}
set2 = {True, False}

print(set1 | set2)
# {False, 1, 2, 3}

print(set2 | set1)
#{False, True, 2, 3}

4 个答案:

答案 0 :(得分:111)

为什么union()不包含所有项

1True是等效的,并被认为是重复的。同样地,0False也是等价的:

>>> 1 == True
True
>>> 0 == False
True

使用哪个等效值

当遇到多个等效值时,设置保持第一个看到的值:

>>> {0, False}
{0}
>>> {False, 0}
{False}

使值与众不同的方法

要将它们视为不同,只需将它们存储在(value, type)对中:

>>> set1 = {(1, int), (2, int), (3, int)}
>>> set2 = {(True, bool), (False, bool)}
>>> set1 | set2
{(3, <class 'int'>), (1, <class 'int'>), (2, <class 'int'>),
 (True, <class 'bool'>), (False, <class 'bool'>)}
>>> set1 & set2
set()

使值不同的另一种方法是将它们存储为字符串:

>>> set1 = {'1', '2', '3'}
>>> set2 = {'True', 'False'}
>>> set1 | set2
{'2', '3', 'False', 'True', '1'}
>>> set1 & set2
set()

希望这能揭开神秘面纱并展示前进的方向: - )

从评论中获救:

这是打破跨类型等价的标准技术(即0.0 == 0True == 1Decimal(8.5) == 8.5)。该技术在Python 2.7的正则表达式模块中用于强制unicode正则表达式与其他等效的正则表达式明显缓存。当typed参数为true时,该技术也在Python 3中用于functools.lru_cache()。

如果OP需要除默认等价关系以外的其他东西,则需要定义一些新的关系。根据用例,可能是字符串不区分大小写,unicode规范化,视觉外观(看起来不同的东西被认为是不同的),标识(没有两个不同的对象被认为是相同的),值/类型对或其他一些定义等价关系的函数。鉴于OP的具体示例,他/她似乎期望按类型或视觉区别进行区分。

答案 1 :(得分:21)

在Python中,object(MongoCursor)[4]False被认为是等效的,0True也是如此。由于1True被视为相同的值,因此只有其中一个可以同时出现在一个集合中。哪一个取决于它们被添加到集合中的顺序。在第一行中,1用作第一个集合,因此我们在结果集中得到set1。在第二组中,1位于第一组中,因此True包含在结果中。

答案 2 :(得分:7)

如果你看一下https://docs.python.org/3/library/stdtypes.html#boolean-values第4.12.10节。布尔值:

  

布尔值是两个常量对象 False和True 。它们用于表示真值(尽管其他值也可以被认为是假或真)。在数字上下文中(例如,当用作算术运算符的参数时),它们的行为分别类似于整数0和1

答案 3 :(得分:5)

比较运算符(==!=)定义为布尔值TrueFalse以匹配1和0.

这就是为什么,在集合联盟中,当它检查True是否已经在新集合中时,它会得到一个真正的答案:

>>> True in {1}
True
>>> 1 in {True}
True