Python中是否有一个函数根据概率分布给出输出?

时间:2019-03-26 13:58:59

标签: python random probability

我有一个数字数组,例如0到8,可能会重复出现在数组中。 我需要从中选择一个数字,数字出现的概率应与该数组中出现的次数成正比。

这是原始数组: ([7, 0, 7, 8, 4, 4, 6, 5, 2, 6, 0, 1, 2, 3, 4, 5, 6, 7, 8])

这是一个数组,其中包含每个数字出现在数组中的次数:
array([ 2., 1., 3., 1., 1., 4., 1., 5., 1.])

这是我尝试以之前描述的方式获取一个索引(度)的代码

tot = sum((deg))
n = np.random.uniform(0, tot)
for i in range(len(deg)):
    if n < deg[i]:
        return i
    n = n - deg[i]
return i

我得到一个2的索引,但我不知道该过程是否正确。你怎么说?

1 个答案:

答案 0 :(得分:2)

您可以简单地在原始输入上使用random.choice。由于所选索引是均匀分布的,因此选择元素的概率将自动与出现次数成正比。无需计算deg

如评论中所指出的,您还可以选择使用random.choices,这不仅使您可以替换收集多个样本,而且可以手动分配每个元素的比例。

例如,以下三个输入应为给定种子选择相同的三个元素:

 x = [1, 2, 3, 2, 7, 7, 7, 7]
 y = [1, 2, 3, 7]
 z = [1, 2, 1, 4]
 w = [0.125, 0.25, 0.125, 0.5]

 random.choices(x, k=3)
 random.choices(y, weights=z, k=3)
 random.choices(y, weights=w, k=3)

要从xyz,请使用collections.Counter

 c = collections.Counter(x)
 y, z = map(list, zip(*c.items()))