创建没有类似交叉的列表

时间:2016-10-12 15:57:15

标签: python python-2.7 open-sesame

我正在尝试构建一个长度为120的列表,其中包含4个数字。 棘手的是,数字不会出现在一行中,每个数字应该完全相同的数量。

这是我的剧本。

import random
List = [1,2,3,4]
seq_CG = random.sample(List,len(List))
for i in range(121):
    randomList = random.sample(List, len(List))
    if randomList[0]!=seq_CG[-1]:
        seq_CG.append(randomList)
        i = len(seq_CG)
print List, randomList, seq_CG

我非常接近。但是有些东西不起作用。也许甚至有一个更短,更随机的解决方案?

在大名单中seq_CG我不希望这些数字连续出现。在我的例子中,它充满了许多较小的列表。然而,拥有120个数字的随机列表甚至更好,每个数字的分布相等,其中数字不会出现在一行中。

2 个答案:

答案 0 :(得分:3)

以下是一些解决方案。

第一个算法在序列中维护索引idx,并且在每个调用idx上随机修改为不同的索引,因此生成的值不可能等于先前的值。

from random import randrange
from itertools import islice
from collections import Counter

def non_repeating(seq):
    m = len(seq)
    idx = randrange(0, m)
    while True:
        yield seq[idx]
        idx = (idx + randrange(1, m)) % m

seq = [1, 2, 3, 4]
print(''.join(map(str, islice(non_repeating(seq), 60))))

ctr = Counter(islice(non_repeating(seq), 12000))
print(ctr)

典型输出

313231412323431321312312131413242424121414314243432414241413
Counter({1: 3017, 4: 3012, 3: 2993, 2: 2978})

该代码产生的值的分布看起来相当均匀,但我还没有用数学方法对其进行分析,并且我不保证其均匀性。

以下代码更复杂,但它确实提供了统一的分布。不会丢弃重复的值,它们会临时添加到重复值池中,并且算法会尽快尝试使用池中的值。如果它无法在池中找到合适的值,则会生成新的随机值。

from random import choice
from itertools import islice
from collections import Counter

def non_repeating(seq):
    pool = []
    prev = None
    while True:
        p = set(pool).difference([prev])
        if p:
            current = p.pop()
            pool.remove(current)
        else:
            current = choice(seq)
            if current == prev:
                pool.append(current)
                continue
        yield current
        prev = current

seq = [1, 2, 3, 4]
print(''.join(map(str, islice(non_repeating(seq), 60))))

ctr = Counter(islice(non_repeating(seq), 12000))
print(ctr)

典型输出

142134314121212124343242324143123212323414131323434212124232
Counter({4: 3015, 2: 3005, 3: 3001, 1: 2979})

如果输入序列的长度仅为2或3,则池可能会变得非常大,但对于较长的序列,它通常只保留一些值。

最后,这是一个提供完全均匀分布的版本。不要试图在2(或更少)元素的输入序列上使用它,因为它可能会卡在无限循环中;当然,无论如何,这种输入序列只有2种解决方案。 :)

我并不为这个相当丑陋的代码感到骄傲,但至少它完成了这项工作。我正在创建一个长度为60的输出列表,以便它非常适合屏幕,但是这段代码可以生成更大的序列。

from random import shuffle
from itertools import groupby
from collections import Counter

def non_repeating(seq, copies=3):
    seq = seq * copies
    while True:
        shuffle(seq)
        result, pool = [], []
        for k, g in groupby(seq):
            result.append(k)
            n = len(list(g)) - 1
            if n:
                pool.extend(n * [k])

        for u in pool:
            for i in range(len(result) - 1):
                if result[i] != u != result[i + 1]:
                    result.insert(i+1, u)
                    break
            else:
                break
        else:
            return result

# Test that sequence doesn't contain repeats
def verify(seq):
    return all(len(list(g)) == 1 for _, g in groupby(seq))

seq = [1, 2, 3, 4]
result = non_repeating(seq, 15)
print(''.join(map(str, result)))
print(verify(result))
print(Counter(result))

典型输出

241413414241343212423232123241234123124342342141313414132313
True
Counter({1: 15, 2: 15, 3: 15, 4: 15})

答案 1 :(得分:2)

一种稍微天真的方法是使用无限循环,然后使用islice来填充重复值,以限制所需的总输出,例如:

from itertools import groupby
from random import choice

def non_repeating(values):
    if not len(values) > 1:
        raise ValueError('must have more than 1 value')
    candidates = iter(lambda: choice(values), object())
    # Python 3.x -- yield from (k for k, g in groupby(candidates))
    # Python 2.x
    for k, g in groupby(candidates):
        yield k

data = [1, 2, 3, 4]
sequence = list(islice(non_repeating(data), 20))
# [3, 2, 1, 4, 1, 4, 1, 4, 2, 1, 2, 1, 4, 1, 4, 3, 2, 3, 4, 3]
# [3, 2, 3, 4, 1, 3, 1, 4, 1, 4, 2, 1, 2, 3, 2, 4, 1, 4, 2, 3]
# etc...