相同的迭代器对象在for循环中产生不同的结果?

时间:2013-08-20 10:40:49

标签: python python-3.x

我在Python中遇到了一个非常奇怪的行为。 使用从UserDict派生的类,迭代器a.items()在for循环中的行为与a.data.items()不同,即使两者相同

Python 3.3.1 (default, Apr 17 2013, 22:32:14) 
[GCC 4.7.3] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from datastruct import QueueDict
>>> a=QueueDict(maxsize=1700)
>>> for i in range(1000):
...     a[str(i)]=1/(i+1)
... 
>>> a.items()
ItemsView(OrderedDict([('991', 0.0010080645161290322), ('992', 0.0010070493454179255), ('993', 0.001006036217303823), ('994', 0.0010050251256281408), ('995', 0.001004016064257028), ('996', 0.0010030090270812437), ('997', 0.001002004008016032), ('998', 0.001001001001001001), ('999', 0.001)]))
>>> a.data.items()
ItemsView(OrderedDict([('991', 0.0010080645161290322), ('992', 0.0010070493454179255), ('993', 0.001006036217303823), ('994', 0.0010050251256281408), ('995', 0.001004016064257028), ('996', 0.0010030090270812437), ('997', 0.001002004008016032), ('998', 0.001001001001001001), ('999', 0.001)]))
>>> a.items()==a.data.items()
True
>>> # nevertheless:
... 
>>> for item in a.items(): print(item)
... 
('992', 0.0010070493454179255)
>>> for item in a.data.items(): print(item)
... 
('993', 0.001006036217303823)
('994', 0.0010050251256281408)
('995', 0.001004016064257028)
('996', 0.0010030090270812437)
('997', 0.001002004008016032)
('998', 0.001001001001001001)
('999', 0.001)
('991', 0.0010080645161290322)
('992', 0.0010070493454179255)
>>> 

类定义如下:

import collections, sys

class QueueDict(collections.UserDict):

    def __init__(self, maxsize=1*((2**10)**2), *args, **kwargs ):
        self._maxsize=maxsize
        super().__init__(*args, **kwargs)
        self.data=collections.OrderedDict(self.data)

    def __getitem__(self, key):
        self.data.move_to_end(key)
        return super().__getitem__(key)

    def __setitem__(self, key, value):
        super().__setitem__(key, value)
        self._purge()

    def _purge(self):
        while sys.getsizeof(self.data) > self._maxsize:
            self.data.popitem(last=False)

这非常令人不安。任何想法如何[通过“视觉”检查,以及(a.items()==a.data.items()) == True]的相同对象,以及它为什么会在for循环中表现不同?

感谢您的帮助和想法!

1 个答案:

答案 0 :(得分:2)

迭代时更改集合可能会(并且在这种情况下)产生一些意想不到的后果。

你的吸气者;

def __getitem__(self, key):
    self.data.move_to_end(key)
    return super().__getitem__(key)

...将当前键移动到集合的末尾,这将使for循环超过a.items,因为它认为它已到达集合的末尾。

注释move_to_end行允许迭代按预期运行。

当你在a.data.items上进行迭代时,你的getter永远不会被调用,所以这不是问题。