识别分类变量的缺失性质

时间:2014-11-24 20:14:33

标签: sas missing-data categorical-data method-missing

你可以给我一些提示,以确定分类变量的缺失性质吗?缺少价值?我的意思是,我对谷歌学者进行了快速搜索,但我没有找到与此相关的任何内容。我怎么能理解丢失值是否完全随机丢失,是随机丢失还是最后丢失,它们不是随机丢失的?除了研究领域,我无法思考任何事情。感谢一些论文的链接,提前致谢。 (我将在sas环境中添加它,但问题与此语言没有特别关系。)

1 个答案:

答案 0 :(得分:0)

由于您已将此标记为SAS,因此您可以采用的一种方法是为每个分类变量创建一个布尔变量,指示每行中是否有缺失值。然后,您可以使用标志对丢失值的频率进行任何分析。例如。您可以使用proc corr查看一个变量的缺失值是否与其他变量的值相关联。

E.g。假设你有这样的情况:

data example;
    set sashelp.class;
    if AGE > 14 then call missing(SEX);
    SEX_MISSING_FLAG = missing(SEX);
run;

然后你可以通过运行以下内容来发现它:

proc corr data = example outp= corr;
    var age weight height sex_missing_flag;
run;

输出:

_TYPE_,_NAME_,Age,Weight,Height,SEX_MISSING_FLAG
MEAN,,13.32,100.03,62.34,0.26
STD,,1.49,22.77,5.13,0.45
N,,19.00,19.00,19.00,19.00
CORR,Age,1.00,0.74,0.81,0.78
CORR,Weight,0.74,1.00,0.88,0.64
CORR,Height,0.81,0.88,1.00,0.55
CORR,SEX_MISSING_FLAG,0.78,0.64,0.55,1.00