我想生成一个整数随机数,其概率分布函数作为列表给出。 例如,如果pdf = [3,2,1]那么我喜欢 rndWDist(PDF) 返回0,1和2,概率为3 / 6,2 / 6和1/6。 我为此编写了自己的函数,因为我无法在随机模块中找到它。
def randintWDist(pdf):
cdf=[]
for x in pdf:
if cdf:
cdf.append(cdf[-1]+x)
else:
cdf.append(x)
a=random.randint(1,cdf[-1])
i=0
while cdf[i]<a:
i=i+1
return i
是否有更短的方法可以达到相同的效果?
答案 0 :(得分:3)
这是一个重复的问题:Generate random numbers with a given (numerical) distribution
作为第一个答案,您可能希望使用scipy.stats.rv_discrete
。
您可以这样使用它:
from scipy.stats import rv_discrete
numbers = (1,2,3)
distribution = (1./6, 2./6, 3./6)
random_variable = rv_discrete(values=(numbers,distribution))
random_variable.rvs(size=10)
这将返回一个包含10个随机值的numpy数组。
答案 1 :(得分:1)
根据您的输入格式,您可以这样做:
def randint_with_dist(pdf):
choices = []
for index, value in enumerate(pdf):
choices.extend(index for _ in range(value))
return random.choice(choices)
由于每次传递相同的pdf
时都会使用相同的列表,您可以考虑缓存列表以提高效率(以空间为代价):
def randint_with_dist(pdf, choices={}):
pdf = tuple(pdf)
if pdf not in choices:
choices[pdf] = []
for index, value in enumerate(pdf):
choices[pdf].extend(index for _ in range(value))
return random.choice(choices[pdf])
答案 2 :(得分:0)
使用numpy(1.7或更新版本),您也可以使用np.random.choice:
In [27]: import numpy as np
In [28]: distribution = (1./6, 2./6, 3./6)
In [29]: np.random.choice(np.arange(len(distribution)), p=distribution)
Out[29]: 0
In [30]: np.random.choice(np.arange(len(distribution)), p=distribution, size=10)
Out[30]: array([2, 1, 1, 2, 2, 0, 1, 0, 1, 0])