假设我在R中有以下数字列表,如何通过指定每个组中需要多少个数字来选择6个随机数字?
r<-c(1,2,3,4,5,6,7,8,9,10)
b<-c(11,12,13,14,15,16,17,18,19,20)
y<-c(21,22,23,24,25,26,27,28,29,30)
g<-c(31,32,33,34,35,36,37,38,39,40)
我该如何选择r中的2个随机数,b中的2个随机数,y中的1个随机数和g中的1个随机数?
我需要我的代码足够灵活以手动输入每个列表中需要多少个数字。根据我的选择,我还希望最终输出只是6个随机数的列表。
答案 0 :(得分:3)
将向量放入一个列表
foo <- list(
c(1,2,3,4,5,6,7,8,9,10),
c(11,12,13,14,15,16,17,18,19,20),
c(21,22,23,24,25,26,27,28,29,30),
c(31,32,33,34,35,36,37,38,39,40)
)
如果您不介意替换,则生成另一个绘制矢量(指定要从哪个列表条目进行采样),然后对该矢量进行迭代。
bar <- c(1, 1, 2, 2, 3, 4)
sapply(bar, function(x) sample(foo[[x]], 1))
如果您不想替换,则只需从每个列表条目中采样一次。为此,您必须使用所需的绘制次数来命名列表条目,并在列表上进行迭代(对于每个条目,请提取名称并对此编号进行采样)。
names(foo) <- c(2, 2, 1, 1)
unlist(sapply(seq_along(foo), function(x) sample(foo[[x]], names(foo[x]))))
另一种解决方案是生成概率向量,并将其作为prob
中的sample
自变量传递。
sample(unlist(foo), length(bar),
prob = rep(table(bar) / length(bar) / lengths(foo), lengths(foo)))
说明:
我们需要从每个条目中获取多少个样本:table(bar)
1 2 3 4
2 2 1 1
为每个条目分配一个概率:table(bar) / length(bar)
1 2 3 4
0.3333333 0.3333333 0.1666667 0.1666667
给每个数字采样的概率为:rep(table(bar) / length(bar) / lengths(foo), lengths(foo))
...
2 2 2 2 2 2 2 2 2 2
0.03333333 0.03333333 0.03333333 0.03333333 0.03333333 0.03333333 0.03333333 0.03333333 0.03333333 0.03333333
3 3 3 3 3 3 3 3 3 3
0.01666667 0.01666667 0.01666667 0.01666667 0.01666667 0.01666667 0.01666667 0.01666667 0.01666667 0.01666667
...