我希望将大型数据集随机分成两个新数据集,比例为70% - 30%。
基本上我需要将70%的大数据集中的随机值分配给newdataset1,将30%的随机值从largedataset分配到newdataset2。
请帮助我帮助我实现它的SAS代码。
虚拟代码真的有帮助..
Proc SQl或SAS声明。任何事情都会对我有用。
答案 0 :(得分:0)
对于复杂的样本设计(如分层随机化,例如),PROC SURVEYSELECT
是一种方法,正如@Keith所说。
但是对于一个简单的随机拆分RANTBL
- 函数就可以解决问题:
data newdataset1 newdataset2;
set have;
flag=rantbl(-1, 0.7, 0.3);
if flag=1 then output newdataset1;
else output newdataset2;
run;