python:如何在不重复项目的情况下制作迭代产品?

时间:2011-06-03 08:14:25

标签: python itertools

我需要一个以与itertools.product类似的方式运行的函数,但不需要重复项。

例如:

no_repeat_product((1,2,3), (5,6))
= ((1,5), (None,6), (2,5), (None,6), ...(None,6))
no_repeat_product((1,2,3), (5,6), (7,8))
= ((1,5,7), (None,None,8), (None,6,7), (None,None,8), ...(None,None,8))

有什么想法吗?

编辑: 我的措辞不正确。我的意思是而不重复连续输出值中相同的数字 例如,

itertools.product((1,2,3), (4,5), (6,7) is
(1,4,6)
(1,4,7), etc  

这里1,4在输出中出现两次。所以,我想跳过与之前的项目相同的数字。所以,我想要的输出是:

(1,4,6)  
(None,None,7)  

当它为None时,可以理解它与结果中的前一项相同。

进一步编辑:

我的解释仍然缺乏清晰度。 我们假设我有书籍列表,章节编号和页码。假设每本书具有相同数量的章节,并且每章具有相同数量的页面。 因此,列表是(book1,book2,book3),(chap1,chap2),(page1,page2,page3)。
现在,假设我想收集每个页面的描述:
itertools.product会给我:

(book1, chap1, page1), (book1, chap1, page2)..... (book3, chap2, page3)

如果我已连续安排这些页面,我不需要重复描述。所以,如果书和章是相同的,在第二页中,我不需要书和章的名字 所以,输出应该是:

(book1, chap1, page1), (None, None, page2), ..   
(when the pages of first chapter are over..) (None, chap2, page1), (None, None, page2)......  
(when the chapters of the first book are over..)(book2, chap1, page1)..............  
(None, None, page3)  

3 个答案:

答案 0 :(得分:2)

def no_repeat_product(*seq):
    def no_repeat(x, known):
        if x in known:
            return None
        else:
            known.add(x)
            return x

    known = set()
    for vals in itertools.product(*seq):
        yield tuple(no_repeat(x, known) for x in vals)

这不会返回之前已经看过的任何值。这是你想要的吗?

如果您只想限制重复上一组结果中出现的值,可以这样做:

def no_repeat_product(*seq):
    prev = None
    for vals in itertools.product(*seq):
        if prev is None:
            yield vals
        else:
            yield tuple((x if x != y else None) for x, y in zip(vals, prev))
        prev = vals

答案 1 :(得分:2)

根据您的评论说明“因为(无,无,8)不会连续发生”,我假设您只想 -ify元素出现在之前的输出中。

def no_repeat_product(*seq):
    previous = (None,)*len(seq)
    for vals in itertools.product(*seq):
        out = list(vals)
        for i,x in enumerate(out):
            if previous[i] == x:
                out[i] = None
        previous = vals
        yield(tuple(out))   

或者,如果您更喜欢更紧凑,更高效(但不太可读)的版本:

def no_repeat_product(*seq):
    previous = (None,)*len(seq)
    for vals in itertools.product(*seq):
        out = tuple((y,None)[x==y] for x,y in itertools.izip(previous, vals))
        previous = vals
        yield(out)       

他们都做同样的事情,并产生以下结果:

for x in no_repeat_product((1,2,3), (5,6), (7,8)): 
    print x 

输出:

(1, 5, 7)
(None, None, 8)
(None, 6, 7)
(None, None, 8)
(2, 5, 7)
(None, None, 8)
(None, 6, 7)
(None, None, 8)
(3, 5, 7)
(None, None, 8)
(None, 6, 7)
(None, None, 8)

有关更新问题的上下文中的示例:

books = ("Book 1", "Book 2")
chapters = ("Chapter 1", "Chapter 2")
pages = ("Page 1", "Page 2", "Page 3")

s1 = max(map(len, books)) + 2  # size of col 1
s2 = max(map(len, chapters)) + 2  # size of col 2
x = lambda s, L: (s, "")[s == None].ljust(L)  # Left justify, handle None

for book, chapter, page in no_repeat_product(books, chapters, pages):
    print x(book, s1), x(chapter, s2), page

这会给你:

Book 1   Chapter 1   Page 1
                     Page 2
                     Page 3
         Chapter 2   Page 1
                     Page 2
                     Page 3
Book 2   Chapter 1   Page 1
                     Page 2
                     Page 3
         Chapter 2   Page 1
                     Page 2
                     Page 3

答案 2 :(得分:2)

使用tee'ed迭代器排序@ ShawnChin答案的功能版本:

from itertools import product,tee,izip
def product_without_repeats(*seq):
    previter,curriter = tee(product(*seq))
    try:
        yield next(curriter)
    except StopIteration:
        pass
    else:
        for prev,curr in izip(previter,curriter):
            yield tuple(y if x!=y else None for x,y in izip(prev,curr))