标签: php algorithm random sampling weighted
如果D表示所有项目的总数并且| D | = n项目的总数量,我想采用m = | S |的随机样本S.元素,m< = n。 D中的每个项目都附有一个权重,表示它出现在S中的概率。
Mi问题是:什么是最好的算法(更有效/易于实施),记住n / 1k< n< 10k和所有项目都将在内存中?