生成加权随机数

时间:2013-11-09 02:13:33

标签: python random generator

嗨,我正在为基因组课做一些代码,而我在某个方面遇到了困难。

我有一组相互排斥的事件event1, event2, ... eventn 概率为p1, p2, ... pn

我想模拟以给定的概率随机抽样一次事件。

输入:概率= {0.3,0.2,0.5}事件{e1,e2,e3} n = 100

输出:e3应为~50,e2为~20,e1为~30。 请注意,这些可能不完全是50,20,30,因为 经验值与理论值不同......

2 个答案:

答案 0 :(得分:5)

Python没有内置任何加权采样功能(NumPy / SciPy),但是对于这样一个非常简单的情况,它很容易:

import itertools
import random

probabilities = [0.3, 0.2, 0.5]
totals = list(itertools.accumulate(probabilities))

def sample():
    n = random.uniform(0, totals[-1])
    for i, total in enumerate(totals):
        if n <= total:
            return i

如果您没有Python 3.2+,则没有accumulate功能;如果列表确实如此简短,你可以使用低效的单行代码伪造它:

totals = [sum(probabilities[:i+1]) for i in range(len(probabilities))]

...或者您可以编写显式循环或丑陋reduce调用,或从the docs复制等效的Python函数。


另请注意,random.uniform(0, totals[-1])只是一种更复杂的撰写random.random()的方法,如果您可以确定您的数字加起来为1.0。


快速测试方法:

>>> samples = [sample() for _ in range(100000)]
>>> samples.count(0)
29878
>>> samples.count(1)
19908
>>> samples.count(2)
50214

这些分别非常接近100000的30%,20%和50%。

答案 1 :(得分:2)

假设我们有三个事件,每个事件分别具有概率.3,.2和.5。然后对于生成的每个样本,我们生成一个范围为[0,1)的数字,让我们称之为“rand”。如果“rand”&lt; .3,我们生成事件1,如果.3&lt; =“rand”&lt; .5,我们生成偶数2,否则我们生成事件3.这可以使用random()来完成,它确实生成了[0,1]范围内的数字。