我有一个数字数组,例如0到8,可能会重复出现在数组中。 我需要从中选择一个数字,数字出现的概率应与该数组中出现的次数成正比。
这是原始数组:
([7, 0, 7, 8, 4, 4, 6, 5, 2, 6, 0, 1, 2, 3, 4, 5, 6, 7, 8])
这是一个数组,其中包含每个数字出现在数组中的次数:
array([ 2., 1., 3., 1., 1., 4., 1., 5., 1.])
这是我尝试以之前描述的方式获取一个索引(度)的代码
tot = sum((deg))
n = np.random.uniform(0, tot)
for i in range(len(deg)):
if n < deg[i]:
return i
n = n - deg[i]
return i
我得到一个2的索引,但我不知道该过程是否正确。你怎么说?
答案 0 :(得分:2)
您可以简单地在原始输入上使用random.choice
。由于所选索引是均匀分布的,因此选择元素的概率将自动与出现次数成正比。无需计算deg
。
如评论中所指出的,您还可以选择使用random.choices
,这不仅使您可以替换收集多个样本,而且可以手动分配每个元素的比例。
例如,以下三个输入应为给定种子选择相同的三个元素:
x = [1, 2, 3, 2, 7, 7, 7, 7]
y = [1, 2, 3, 7]
z = [1, 2, 1, 4]
w = [0.125, 0.25, 0.125, 0.5]
random.choices(x, k=3)
random.choices(y, weights=z, k=3)
random.choices(y, weights=w, k=3)
要从x
到y
和z
,请使用collections.Counter
:
c = collections.Counter(x)
y, z = map(list, zip(*c.items()))