答案 0 :(得分:0)
由于您已将此标记为SAS,因此您可以采用的一种方法是为每个分类变量创建一个布尔变量,指示每行中是否有缺失值。然后,您可以使用标志对丢失值的频率进行任何分析。例如。您可以使用proc corr
查看一个变量的缺失值是否与其他变量的值相关联。
E.g。假设你有这样的情况:
data example;
set sashelp.class;
if AGE > 14 then call missing(SEX);
SEX_MISSING_FLAG = missing(SEX);
run;
然后你可以通过运行以下内容来发现它:
proc corr data = example outp= corr;
var age weight height sex_missing_flag;
run;
输出:
_TYPE_,_NAME_,Age,Weight,Height,SEX_MISSING_FLAG
MEAN,,13.32,100.03,62.34,0.26
STD,,1.49,22.77,5.13,0.45
N,,19.00,19.00,19.00,19.00
CORR,Age,1.00,0.74,0.81,0.78
CORR,Weight,0.74,1.00,0.88,0.64
CORR,Height,0.81,0.88,1.00,0.55
CORR,SEX_MISSING_FLAG,0.78,0.64,0.55,1.00