从itertools.cycle中提取列表

时间:2012-08-20 12:45:33

标签: python python-2.7 itertools

我有一个包含itertools.cycle实例的类,我希望能够复制它。一种方法(我能想出的唯一方法)是提取初始可迭代(这是一个列表),并存储周期所在的位置。

不幸的是我无法掌握我用来创建循环实例的列表,似乎也没有明显的方法来实现它:

import itertools
c = itertools.cycle([1, 2, 3])
print dir(c)
['__class__', '__delattr__', '__doc__', '__format__', '__getattribute__', 
 '__hash__', '__init__', '__iter__', '__new__', '__reduce__', 
 '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', 
 '__subclasshook__', 'next']

我可以提出一些合理的理由说明为什么对某些类型的输入迭代不允许这样做,但是对于一个元组甚至一个列表(可变性可能是一个问题),我不明白为什么它不会不可能。

任何人都知道 if 可以从itertools.cycle实例中提取非无限可迭代。如果没有,任何人都知道为什么这个想法很糟糕?

4 个答案:

答案 0 :(得分:3)

这是不可能的。如果你查看itertools.cycle代码,你会发现它没有存储序列的副本。它只创建一个iterable并将iterable中包含的值存储在新创建的列表中:

static PyObject *
cycle_new(PyTypeObject *type, PyObject *args, PyObject *kwds)
{
    PyObject *it;
    PyObject *iterable;
    PyObject *saved;
    cycleobject *lz;

    if (type == &cycle_type && !_PyArg_NoKeywords("cycle()", kwds))
        return NULL;

    if (!PyArg_UnpackTuple(args, "cycle", 1, 1, &iterable))
        return NULL;
    /* NOTE: they do not store the *sequence*, only the iterator */
    /* Get iterator. */
    it = PyObject_GetIter(iterable);
    if (it == NULL)
        return NULL;

    saved = PyList_New(0);
    if (saved == NULL) {
        Py_DECREF(it);
        return NULL;
    }

    /* create cycleobject structure */
    lz = (cycleobject *)type->tp_alloc(type, 0);
    if (lz == NULL) {
        Py_DECREF(it);
        Py_DECREF(saved);
        return NULL;
    }
    lz->it = it;
    lz->saved = saved;
    lz->firstpass = 0;

    return (PyObject *)lz;
}

这意味着在做的时候:

itertools.cycle([1,2,3])

您创建的列表只有一个引用,它保存在循环使用的迭代器中。 当迭代器耗尽时,迭代器将被删除并创建一个新的迭代器:

    /* taken from the "cycle.next" implementation */
    it = PyObject_GetIter(lz->saved);
    if (it == NULL)
        return NULL;
    tmp = lz->it;
    lz->it = it;
    lz->firstpass = 1;
    Py_DECREF(tmp);   /* destroys the old iterator */

这意味着在执行一个循环后,列表将被销毁。

无论如何,如果您需要访问此列表,只需在调用itertools.cycle之前在某处引用它。

答案 1 :(得分:0)

如果您有办法知道cycle所产生的对象的某些属性,那么您可以推断出内部列表。例如,如果您知道循环中的所有对象都是不同的并且除了您之外没有其他任何东西从cycle迭代器读取,那么您只需等待您看到的第一个再次出现(使用{进行测试) {1}}而非is)终止内部列表。

但是如果没有这些知识,就没有任何保证,在某些情况下,你选择猜测循环的方法会失败。

答案 2 :(得分:0)

好的,所以我接受了@ Bakuriu的答案,因为它在技术上是正确的。无法复制/挑选itertools.cycle对象。

我已经实现了一个itertools.cycle的子类,其中 可选(带有一些额外的铃声和口哨声)。

import itertools


class FiniteCycle(itertools.cycle):
    """
    Cycles the given finite iterable indefinitely. 
    Subclasses ``itertools.cycle`` and adds pickle support.
    """
    def __init__(self, finite_iterable):
        self._index = 0
        self._iterable = tuple(finite_iterable)
        self._iterable_len = len(self._iterable)
        itertools.cycle.__init__(self, self._iterable)

    @property
    def index(self):
        return self._index

    @index.setter
    def index(self, index):
        """
        Sets the current index into the iterable. 
        Keeps the underlying cycle in sync.

        Negative indexing supported (will be converted to a positive index).
        """
        index = int(index)
        if index < 0:
            index = self._iterable_len + index
            if index < 0:
                raise ValueError('Negative index is larger than the iterable length.')

        if index > self._iterable_len - 1:
            raise IndexError('Index is too high for the iterable. Tried %s, iterable '
                             'length %s.' % (index, self._iterable_len))

        # calculate the positive number of times the iterable will need to be moved
        # forward to get to the desired index
        delta = (index + self._iterable_len - self.index) % (self._iterable_len)

        # move the finite cycle on ``delta`` times.
        for _ in xrange(delta):
            self.next()

    def next(self):
        self._index += 1
        if self._index >= self._iterable_len:
            self._index = 0
        return itertools.cycle.next(self)

    def peek(self):
        """
        Return the next value in the cycle without moving the iterable forward.
        """
        return self._iterable[self.index]

    def __reduce__(self):
        return (FiniteCycle, (self._iterable, ), {'index': self.index})

    def __setstate__(self, state):
        self.index = state.pop('index')

一些示例用法:

c = FiniteCycle([1, 2, 3])

c.index = -1
print c.next() # prints 3

print [c.next() for _ in xrange(4)] # prints [1, 2, 3, 1]

print c.peek() # prints 2
print c.next() # prints 2

import pickle
import cStringIO
serialised_cycle = pickle.dumps(c)

del c

c = pickle.loads(serialised_cycle)

print c.next() # prints 3
print c.next() # prints 1

欢迎反馈。

谢谢,

答案 3 :(得分:0)

根据您使用cycle的方式,您甚至可以摆脱像这样简单的自定义类包装器:

class SmartCycle:
    def __init__(self, x):
        self.cycle = cycle(x)
        self.to_list = x

    def __next__(self):
        return next(self.cycle)

例如

> a = SmartCycle([1, 2, 3])
> for _ in range(4):
>     print(next(a))
1
2
3
1

> a.to_list
[1, 2, 3]