itertools.tee如何工作,可以复制'itertools.tee'来复制以保存它的“状态”?

时间:2010-10-18 07:34:32

标签: python iterator duplicates tee

以下是有关itertools.tee的一些测试:

    li = [x for x in range(10)]
    ite = iter(li)
==================================================
    it = itertools.tee(ite, 5)
    >>> type(ite)
    <type 'listiterator'>
    >>> type(it)
    <type 'tuple'>
    >>> type(it[0])
    <type 'itertools.tee'>
    >>> 

    >>> list(ite)
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> list(it[0])          # here I got nothing after 'list(ite)', why?
    []
    >>> list(it[1])
    []
====================play again===================
    >>> ite = iter(li)
    it = itertools.tee(ite, 5)
    >>> list(it[1])
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> list(it[2])
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> list(it[3])
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> list(it[4])
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> list(ite)
    []                       # why I got nothing? and why below line still have the data?   
    >>> list(it[0])
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> list(it[0])
    []
====================play again===================    
    >>> ite = iter(li)
    itt = itertools.tee(it[0], 5)    # tee the iter's tee[0].
    >>> list(itt[0])
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> list(itt[1])
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> list(it[0])
    []                               # why this has no data?
    >>> list(it[1])
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    >>> list(ite)
    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]  

我的问题是

  1. tee如何工作以及为什么有时原始iter'有数据'而有时候它没有?
  2. 我可以保留一个深层副本作为“状态种子”来保持原始迭代器状态并将它开发以便以后使用吗?
  3. 我可以交换2个帖子还是2个itertools.tee
  4. 谢谢!

1 个答案:

答案 0 :(得分:11)

tee接管原始迭代器;一旦你开发了一个迭代器,就丢弃原来的迭代器,因为发球台拥有它(除非你真的知道你在做什么)。

您可以使用copy模块复制一个T恤:

import copy, itertools
it = [1,2,3,4]
a, b = itertools.tee(it)
c = copy.copy(a)

...或致电a.__copy__()

请注意tee的工作原理是跟踪原始迭代器消耗的所有迭代值,这些值仍可能被副本使用。

例如,

a = [1,2,3,4]
b, c = itertools.tee(a)
next(b)

此时,bc下方的T恤对象已读取一个值1。它将它存储在内存中,因为它必须在迭代c时记住它。它必须保留内存中的每个值,直到它被发球台的所有副本消耗。

这样做的结果是你需要通过复制T恤来小心“保存状态”。如果你实际上没有使用“已保存状态”T恤中的任何值,那么你将使得tee永远保留迭代器在内存中返回的每个值(直到被复制的tee被丢弃)并收集)。