如何从Python列表中获取所有独特的组合及其多重性?

时间:2016-03-03 20:55:24

标签: python combinatorics

我知道itertools有一种生成组合的方法,如下所述:Get unique combinations of elements from a python list。但是,我正在寻找一个迭代器,它提供了唯一的组合它们的多重性。

示例:我的表达式仅取决于我从列表L = [2,1,2,2]中选择的2个元素的组合。我需要对所有组合的结果求和。我想要的是一个迭代器,例如(([1,2],3),([2,2],3))。这样,我可以只计算2个唯一组合的表达式并乘以3,而不是计算所有6个组合,其中许多组合给出相同的结果。

2 个答案:

答案 0 :(得分:2)

您可以将itertools.combinationscollections.Counter合并。

import itertools
import collections  

L =  [2,1,2,2]
c = collections.Counter()
c.update(map(tuple, map(sorted, itertools.combinations(L, 2))))

c.items()然后给出:

>>> c.items()
[((1, 2), 3), ((2, 2), 3)]

要对其进行细分,itertools.combinations(L, 2)会提供长度为L的所有有序组合。然后我们使用sorted使它们具有可比性,因为collections.Counter将使用散列和平等计数。最后,因为list对象不可清除,我们将它们转换为tuple个对象。

答案 1 :(得分:0)

最后,我的代码花了很长时间才明确计算每个可能的组合,所以我想出了一种方法,只找到唯一的组合,然后分析计算它们的多重性。 它基于以下思想:调用输入列表A和每个子集k中的元素数量。首先对列表进行排序并初始化指向A的前k个元素的k个指针。然后反复尝试将最右边的指针向右移动,直到遇到新值。每次移动另一个指针而不是最右边的指针时,所有指向其右边的指针都被设置为其邻居,例如如果指针1移动到索引6,则指针2移动到索引7,依此类推。

任何组合C的多重性可以通过乘以二项式系数(N_i,m_i)得到,其中N_i和m_i分别是A和C中元素i的出现次数。

以下是蛮力方法的实现,以及利用唯一性的方法。

此图比较了蛮力计数与我的方法的运行时间。当输入列表包含大约20个元素时,计数变得不可行。 Runtime comparison

# -*- coding: utf-8 -*-
from __future__ import division

from itertools import combinations
from collections import Counter
from operator import mul
import numpy as np
from scipy.special import binom

def brute(A, k):
    '''This works, but counts every combination.'''
    A_sorted = sorted(A)
    d = {}
    for comb in combinations(A_sorted, k):
        try:
            d[comb] += 1
        except KeyError:
            d[comb] = 1
        #
    return d


def get_unique_unordered_combinations(A, k):
        '''Returns all unique unordered subsets with size k of input array.'''
    # If we're picking zero elements, we can only do it in one way. Duh.
    if k < 0:
        raise ValueError("k must be non-negative")

    if k == 0 or k > len(A):
        yield ()
        return  # Done. There's only one way to select zero elements :)

    # Sorted version of input list
    A = np.array(sorted(A))
    # Indices of currently selected combination
    inds = range(k)
    # Pointer to the index we're currently trying to increment
    lastptr = len(inds) - 1

    # Construct list of indices of next element of A different from current.
    # e.g. [1,1,1,2,2,7] -> [3,3,3,5,5,6] (6 falls off list)
    skipper = [len(A) for a in A]
    prevind = 0
    for i in xrange(1, len(A)):
        if A[i] != A[prevind]:
            for j in xrange(prevind, i):
                skipper[j] = i
            prevind = i
        #

    while True:
        # Yield current combination from current indices
        comb = tuple(A[inds])
        yield comb

        # Try attempt to change indices, starting with rightmost index
        for p in xrange(lastptr, -1 , -1):
            nextind = skipper[inds[p]]
            #print "Trying to increment index %d to %d"  % (inds[p], nextind)
            if nextind + (lastptr - p) >= len(A):
                continue  # No room to move this pointer. Try the next
            #print "great success"
            for i in xrange(lastptr-p+1):
                inds[p+i] = nextind + i
            break
        else:
            # We've exhausted all possibilities, so there are no combs left
            return