从具有一列的数据集中采样分布

时间:2016-11-13 20:35:46

标签: r sampling

我想为平均值创建一个采样分布。我有一个变量x至少有一万个值。我想要500个样本(n = 10),然后在直方图中显示样本均值的分布。我认为它适用于以下内容,但任何人都可以检查这是否是我的意思并告诉我apply函数中的2代表什么?

x <- rnorm(10000, 7.5, 1.5)
draws = sample(x, size = 10 * 500, replace = TRUE)
draws = matrix(draws, 10)
drawmeans = apply(draws, 2, mean)
hist(drawmeans) 

非常感谢!

1 个答案:

答案 0 :(得分:2)

如果您愿意,可以使用replicate执行此操作。许多不同方式之一。对于数据框df

out = replicate(500, mean(sample(df$Scores,10)))
hist(out)