Question

我有一个数字数组，例如0到8，可能会重复出现在数组中。我需要从中选择一个数字，数字出现的概率应与该数组中出现的次数成正比。

这是原始数组： ([7, 0, 7, 8, 4, 4, 6, 5, 2, 6, 0, 1, 2, 3, 4, 5, 6, 7, 8])

这是一个数组，其中包含每个数字出现在数组中的次数：
array([ 2., 1., 3., 1., 1., 4., 1., 5., 1.])

这是我尝试以之前描述的方式获取一个索引（度）的代码

tot = sum((deg))
n = np.random.uniform(0, tot)
for i in range(len(deg)):
    if n < deg[i]:
        return i
    n = n - deg[i]
return i

我得到一个2的索引，但我不知道该过程是否正确。你怎么说？

Answer 1

您可以简单地在原始输入上使用random.choice。由于所选索引是均匀分布的，因此选择元素的概率将自动与出现次数成正比。无需计算deg。

如评论中所指出的，您还可以选择使用random.choices，这不仅使您可以替换收集多个样本，而且可以手动分配每个元素的比例。

例如，以下三个输入应为给定种子选择相同的三个元素：

 x = [1, 2, 3, 2, 7, 7, 7, 7]
 y = [1, 2, 3, 7]
 z = [1, 2, 1, 4]
 w = [0.125, 0.25, 0.125, 0.5]

 random.choices(x, k=3)
 random.choices(y, weights=z, k=3)
 random.choices(y, weights=w, k=3)

要从x到y和z，请使用collections.Counter：

 c = collections.Counter(x)
 y, z = map(list, zip(*c.items()))

Python中是否有一个函数根据概率分布给出输出？

1 个答案: