我有1500个观测数据集,有两个变量:年龄和贷款金额。 我需要在10组中以相同的观察数量分发这些观察结果,其中每组的年龄均值和贷款额均值相同。
无法找到哪些程序可以帮助我:(
任何人都可以给我搜索方向吗?
答案 0 :(得分:1)
我能想到的最简单的选择是生成一个随机变量,然后使用proc rank
将数据集拆分为10个不相交的子集,平均年龄和贷款额大致相等。
E.g。
data temp / view = temp;
set yourdata;
call streaminit(1); /*Set seed value for PRNG*/
random_factor = rand('uniform');
run;
proc rank data = temp out = want groups = 10;
var random_factor;
run;
/*Sort so that you can use by-group processing in subsequent analysis*/
proc sort data = want;
by random_factor;
run;