我试图在R中使用bootstrapping重新采样一组二进制选择。我可以从50人口中获得10个“是”或“否”答案的样本。
n <- 50
x <- (c(rep("YES", 25), rep("NO", 25)))
sample.1 <- sample(x,10)
(sample.1)
[1] "YES" "NO" "NO" "NO" "NO" "NO" "NO" "NO" "NO" "YES"
然而,我需要重复大约1,000次(或任何x次)并将每个存储在它自己的对象中(sample.1将有10个答案,sample.2将有10个答案等等) 每个需要分开的原因是每个人都可以从“是”答案的比例产生自己的置信区间,并且置信区间的范围将被绘制成直方图。 这是用for循环实现的吗?如果是这样,怎么样?
答案 0 :(得分:0)
library(dplyr)
data_frame(x = (c(rep("YES", 25), rep("NO", 25))) %>%
merge(data_frame(i = 1:1000)) %>%
group_by(i) %>%
sample_n(10, replace = TRUE)
在R中,没有索引的合并需要交叉连接。这将复制您的数据,然后以不同方式重新采样每个复制。也许效率不高。