我在R中还很新,我有一个非常简单的问题,希望你能回答。
我处理数据集: GSS 2010 。我有一个每个受访者的id,我有9个数字级别的变量'region'。在所有2044年对794个变量的观察中。
我想绘制一个大小为100的样本,每个层与其种群大小(完整的GSS)成比例地采样。
我查看了“抽样”和“调查”包,但不幸的是我无法抽取样本。
到目前为止,我最好的猜测是这样的:
#Stratified subsample of GSS2010; regions as strata
s=strata(GSS2010,c("region"),size=c(100), method="systematic", pik=id$region)
我希望你能帮忙。非常感谢你提前。
最佳, 索菲
答案 0 :(得分:0)
s <- GSS2010[sample(dim(GSS2010)[1]),]
这将在数据框中选择数百行。每个区域被挑选的概率将与数据帧中该区域的线数成比例。
如果这不是你想要的,请编辑句子
“每个层与其人口规模(完整的GSS)成比例地采样。”
使其更清晰。