这可能听起来像是一个非常天真的问题,但这就是我正在做的事情,这就是为什么这让我感到难过。
我有1000个样本的人口,我试图使用R中的以下代码对5%,10%,15%...... 100%进行子采样。
subData <- replicate(30, sample(Data,55,replace=TRUE))
然后我计算平均值和标准差以进行进一步分析。令我困惑的是,当我选择100%的人口并将其复制30次时,使用replace = TRUE,为什么标准偏差意味着非零?当然,如果一个人选择所有数据点100次并计算平均值它应该是相同的,因此标准差应该是0.我错过了什么或者我在R中的代码做错了吗?
非常感谢任何帮助!