在SAS eminer中使用集成模型加入决策树和两个回归模型,并且需要在SAS Eguide中收集变量以对新数据进行评分。
所有三个模型都在具有开始和结束组的段(其中有30个)上循环。
我知道,对于回归模型,变量存储在emws1 / reg_effects中,并且得出的结论是emws1 / reg_effects_loop将为每个循环的回归模型提供所有输入变量。
但是,我找不到用于决策树或其他模型的类似文件。
我可以找到例如emws1 / tree_variableset-但这变量太少了(我认为这是针对单个段的-大概是最后一个)。
当然,如果某个地方有一个最终列表(也许在集合模型文件中?),其中包含该模型所有部分中使用的最好的所有变量(而不是为每个模型分别导入)。
在此先感谢您,如果有任何不清楚的地方,请告诉我。
我目前正在通过以下方式导入变量:
data frankie.&projx._eff_tree (keep=variable);
rename name=variable;
set &SEM..tree_variableset (where=(role='INPUT'));
run;
data frankie.&projx._eff_reg (keep=variable);
rename name=variable;
set &SEM..reg_effects_loop (where=(role='INPUT'));
run;
data frankie.&projx._eff_princomp (keep=variable);
rename name=variable;
set &SEM..princomp_variableset (where=(role='INPUT'));
run;
data frankie.&projx.eff_all;
set
frankie.&projx._eff_reg
frankie.&projx._eff_tree
frankie.&projx._eff_princomp
;
run;
这似乎并没有提供所有变量,所以当我使用得分代码进行得分时,某些变量(上表中未包括)会以空值出现在得分数据中。