我知道之前已经提出过类似的问题,但我还没有找到答案。这似乎是一个我想念的简单解决方案。
我有大约20,000名参与者的样本,并希望从此样本中随机选择2500来接收礼品卡,另一个独特的2500(不在第一组中)以获得现金津贴。不得以任何方式重复/重复参与者。参与者由唯一ID标识。
我为代表参与者的每一行创建索引(我相信这一步可以避免)。
Npool=1:dim(pool_20K)[[1]]
giftcards=sample(Npool,2500)
- 如何创建现金津贴组,使其成为独特的参与者,并且不包括为礼品卡选择的那些?
之后,我会将索引与数据结合起来
giftcards_ids=pool_20K[giftcards, ]
有什么见解?我觉得我复杂化了一个相当简单的问题。
先谢谢!!
答案 0 :(得分:1)
随机播放整个内容,然后选择子集:
shuffled.indices = sample(nrow(pool_20K))
giftcards = shuffled.indices[1:2500]
cash = shuffled.indices[2501:5000]