我试图使用箱线图检查类别变量和多个数字变量之间的关系。我正在使用kaggle的乳腺癌数据集: https://www.kaggle.com/uciml/breast-cancer-wisconsin-data
数据的“诊断”列为分类标准/因变量(属于分类),其他30列(全数字)为解释变量,例如“ radius_mean”,“ radius_se”,“ radius_worst”等。
我的要求不是按名称列出所有30个变量
'plot(radius_mean radius_se ...)* diagnosis;',
有没有一种方法可以使用更简单的命令来引用所有30个变量名?
谢谢!
答案 0 :(得分:0)
只需使用系统视图VCOLUMN来询问sas自身具有哪些字段
proc sql
select name
into :num_vars separated by ' '
from SASHELP.VCOLUMN
where libname = 'YOUR_LIB' /* upper case */
and memname = 'YOUR_MEMBER' /* upper case */
and name not in ('id', 'diagnosis'); /* correct case */
quit;
这将创建一个宏变量,其中列出了您需要的所有变量
%put &num_vars;
现在使用
proc boxplot data=YOUR_LIB.YOUR_MEMBER;
plot (&num_vars)*diagnosis;
run;