我有PROC SURVEYSELECT
的示例,其中我创建了四个组,每组包含五个ID。我希望能够采用随机样本,其中不同分层(即组)中的ID不重叠。我怎么能做到这一点?请注意,每个组具有相同的重复ID - 1和2.接下来的三个ID对于该组是唯一的。
示例代码:
data survey;
input group $ id;
datalines;
a 1
a 2
a 3
a 4
a 5
b 1
b 2
b 6
b 7
b 8
c 1
c 2
c 9
c 10
c 11
d 1
d 2
d 12
d 13
d 14
;
proc surveyselect data=survey
method=srs n=3
out=MyStratExample;
strata group;
run;
proc print data=MyStratExample;
run;
当前输出:
a 1 0.6 1.6666666667
a 3 0.6 1.6666666667
a 4 0.6 1.6666666667
b 1 0.6 1.6666666667
b 2 0.6 1.6666666667
b 7 0.6 1.6666666667
c 1 0.6 1.6666666667
c 2 0.6 1.6666666667
c 11 0.6 1.6666666667
d 1 0.6 1.6666666667
d 2 0.6 1.6666666667
d 13 0.6 1.6666666667
我们可以观察到,在多个组中,SAS正在采用相同ID变量的样本。