SAS proc箱图绘制多个变量

时间:2019-01-17 03:15:33

标签: sas boxplot

我试图使用箱线图检查类别变量和多个数字变量之间的关系。我正在使用kaggle的乳腺癌数据集: https://www.kaggle.com/uciml/breast-cancer-wisconsin-data

数据的“诊断”列为分类标准/因变量(属于分类),其他30列(全数字)为解释变量,例如“ radius_mean”,“ radius_se”,“ radius_worst”等。

我的要求不是按名称列出所有30个变量

'plot(radius_mean radius_se ...)* diagnosis;',

有没有一种方法可以使用更简单的命令来引用所有30个变量名?

谢谢!

1 个答案:

答案 0 :(得分:0)

只需使用系统视图VCOLUMN来询问sas自身具有哪些字段

proc sql
    select name
    into :num_vars separated by ' '
    from SASHELP.VCOLUMN
    where libname = 'YOUR_LIB'              /* upper case */
      and memname = 'YOUR_MEMBER'           /* upper case */
      and name not in ('id', 'diagnosis'); /* correct case */
quit;

这将创建一个宏变量,其中列出了您需要的所有变量

%put &num_vars;

现在使用

proc boxplot data=YOUR_LIB.YOUR_MEMBER;
    plot (&num_vars)*diagnosis; 
run;