Question

我知道之前已经提出过类似的问题，但我还没有找到答案。这似乎是一个我想念的简单解决方案。

我有大约20,000名参与者的样本，并希望从此样本中随机选择2500来接收礼品卡，另一个独特的2500（不在第一组中）以获得现金津贴。不得以任何方式重复/重复参与者。参与者由唯一ID标识。

我为代表参与者的每一行创建索引（我相信这一步可以避免）。

Npool=1:dim(pool_20K)[[1]]
giftcards=sample(Npool,2500)

- 如何创建现金津贴组，使其成为独特的参与者，并且不包括为礼品卡选择的那些？

之后，我会将索引与数据结合起来

giftcards_ids=pool_20K[giftcards, ]

有什么见解？我觉得我复杂化了一个相当简单的问题。

先谢谢!!

Answer 1

随机播放整个内容，然后选择子集：

shuffled.indices = sample(nrow(pool_20K))

giftcards = shuffled.indices[1:2500]
cash = shuffled.indices[2501:5000]