我有一个包含多个变量的大型数据集。
使用其中两个变量et1和bl1,我想创建包含每个变量类别的输出数据集。
Et1有七个级别,编码为数字(虽然我的格式适用于数字类别。
Bl1有四个级别,它们也被编码为数字(这也是一种格式)。
我想创建28个输出数据集(et1 * 7和bl1 * 4 = 28),理想情况下使用格式名称作为数据集名称。
干杯, 约翰
答案 0 :(得分:2)
proc format;
value classa
1='ADATA'
2='BDATA'
;
value classb
1='CDATA'
2='DDATA'
;
run;
data in;
length class_a class_b $ 8;
do i=1 to 2;
do j=1 to 2;
class_a=trim(left(put(i,classa.)));
class_b=trim(left(put(j,classb.)));
someVar=ranuni(0);
someOtherVar=ranuni(0);
output;
end;
end;
run;
options mprint symbolgen mlogic;
%macro separate(dsn=, classvar1=, classvar2=);
proc sql;
select distinct trim(left(&classvar1)) || '_' || trim(left(&classvar2))
into :dsnames separated by ' '
from &dsn;
quit;
data &dsnames.;
set &dsn;
%let idx=1;
%let thiscombo=%sysfunc(scan(&dsnames,&idx,%str( )));
%do %while(%length(&thiscombo) > 0);
IF ( &classvar1 = %sysfunc(quote(%sysfunc(scan(&thiscombo,1,%str(_))))) AND
&classvar2 = %sysfunc(quote(%sysfunc(scan(&thiscombo,2,%str(_))))) )
THEN OUTPUT &thiscombo;
%let idx=%eval(&idx+1);
%let thiscombo=%sysfunc(scan(&dsnames,&idx,%str( )));
%end;
run;
%mend;
%separate(dsn=in, classvar1=class_a, classvar2=class_b);