分层抽样

时间:2015-02-24 17:21:01

标签: r sampling

我在R中还很新,我有一个非常简单的问题,希望你能回答。

我处理数据集: GSS 2010 。我有一个每个受访者的id,我有9个数字级别的变量'region'。在所有2044年对794个变量的观察中。

我想绘制一个大小为100的样本,每个层与其种群大小(完整的GSS)成比例地采样。

我查看了“抽样”和“调查”包,但不幸的是我无法抽取样本。

到目前为止,我最好的猜测是这样的:

#Stratified subsample of GSS2010; regions as strata
s=strata(GSS2010,c("region"),size=c(100), method="systematic", pik=id$region)

我希望你能帮忙。非常感谢你提前。

最佳, 索菲

1 个答案:

答案 0 :(得分:0)

我认为     样品 基数R中的函数应该足够了:

    s <- GSS2010[sample(dim(GSS2010)[1]),]

这将在数据框中选择数百行。每个区域被挑选的概率将与数据帧中该区域的线数成比例。

如果这不是你想要的,请编辑句子

“每个层与其人口规模(完整的GSS)成比例地采样。”

使其更清晰。