如何对 N 个随机值进行采样,以便满足以下约束条件?
以下步骤是我的第一次尝试。
def proportions(N):
proportions = list()
for value in sorted(numpy.random.random(N - 1) * 0.98 + 0.01):
prop = value - sum(proportions)
proportions.append(prop)
prop = 1.0 - sum(proportions)
proportions.append(prop)
return proportions
* 0.98 + 0.01
位用于强制执行≥1%的约束。这在边距上起作用,但在内部不起作用-如果两个随机值的距离<0.01,则不会捕获/校正该值。示例:
>>> numpy.random.seed(2000)
>>> proportions(5)
[0.3397481983960182, 0.14892479749759702, 0.07456518420712799, 0.005868759570153426, 0.43089306032910335]
有什么建议要解决这种破损的方法,或者用更好的方法代替它?
答案 0 :(得分:1)
您可以改编Mark Dickinson's nice solution:
import random
def proportions(n):
dividers = sorted(random.sample(range(1, 100), n - 1))
return [(a - b) / 100 for a, b in zip(dividers + [100], [0] + dividers)]
print(proportions(5))
# [0.13, 0.19, 0.3, 0.34, 0.04]
# or
# [0.31, 0.38, 0.12, 0.05, 0.14]
# etc
请注意,这假定“没有一个值小于0.01”是固定阈值
更新:如果我们采用阈值的倒数并将其用于替换建议代码中的硬编码100
值,则可以概括一下。
def proportions(N, T=0.01):
limit = int(1 / T)
dividers = sorted(random.sample(range(1, limit), N - 1))
return [(a - b) / limit for a, b in zip(dividers + [limit], [0] + dividers)]
答案 1 :(得分:0)
那呢?