Question

嗨，我正在为基因组课做一些代码，而我在某个方面遇到了困难。

我有一组相互排斥的事件 event1, event2, ... eventn 概率为 p1, p2, ... pn

我想模拟以给定的概率随机抽样一次事件。

输入：概率= {0.3,0.2,0.5}事件{e1，e2，e3} n = 100

输出：e3应为~50，e2为~20，e1为~30。请注意，这些可能不完全是50,20,30，因为经验值与理论值不同......

Answer 1

Python没有内置任何加权采样功能（NumPy / SciPy），但是对于这样一个非常简单的情况，它很容易：

import itertools
import random

probabilities = [0.3, 0.2, 0.5]
totals = list(itertools.accumulate(probabilities))

def sample():
    n = random.uniform(0, totals[-1])
    for i, total in enumerate(totals):
        if n <= total:
            return i

如果您没有Python 3.2+，则没有accumulate功能;如果列表确实如此简短，你可以使用低效的单行代码伪造它：

totals = [sum(probabilities[:i+1]) for i in range(len(probabilities))]

...或者您可以编写显式循环或丑陋reduce调用，或从the docs复制等效的Python函数。

另请注意，random.uniform(0, totals[-1])只是一种更复杂的撰写random.random()的方法，如果您可以确定您的数字加起来为1.0。

快速测试方法：

>>> samples = [sample() for _ in range(100000)]
>>> samples.count(0)
29878
>>> samples.count(1)
19908
>>> samples.count(2)
50214

这些分别非常接近100000的30％，20％和50％。

Answer 2

假设我们有三个事件，每个事件分别具有概率.3，.2和.5。然后对于生成的每个样本，我们生成一个范围为[0,1）的数字，让我们称之为“rand”。如果“rand”＆lt; .3，我们生成事件1，如果.3＆lt; =“rand”＆lt; .5，我们生成偶数2，否则我们生成事件3.这可以使用random()来完成，它确实生成了[0,1]范围内的数字。

生成加权随机数

2 个答案: