如何在SPSS中对分类变量进行单个插补?

时间:2015-11-03 16:22:59

标签: spss missing-data

我的主管确信,可以在SPSS中执行以下单一插补分类变量缺失值的程序:缺少对该变量的观察结果随机分配变量类别(级别)在它们出现的相同分布中没有遗漏的观察结果。

所以,一个愚蠢的例子:我在8个观察中有一个二元变量(比如性别); 6个观察值中没有丢失变量,0 =男性3(50%),1 =女性3(50%);该程序将随机分配剩余的2个缺失的观察结果,性别0 =男性为1,女性为1 =另一个,因此分布仍为50%-50%。数据集将由

创建
data list free/gender.
begin data
0 1 0 1 0 1 '' ''
end data.

我可以在R中执行该过程,您可以自由地操纵向量等。但经过几天的学习和网上冲浪,我无法在SPSS中做到这一点。只有内置的单一插补方法,如期望最大化方法,我不能轻易手动完成。 并不是说我不相信这种方法可以完全最大化。假设在我的示例数据集中还有一个缺失的观察结果:您将有3个缺失的观察结果,因此您将被迫拥有一个性别的33.3%和另一个性别的66.6%^。在大多数情况下,您将无法再现与非缺失观察中完全相同的水平分布。最后的选择必须由人来完成。

你会怎么做?我的主管错了吗?

重要提示:这是关于程序,而不是这种令人难以置信的粗略估算方法的有效性。

1 个答案:

答案 0 :(得分:1)

您可以在"转换 - >下的菜单中找到一些缺失数据的替换功能。替换缺失值"。

我认为,您正在寻找的转型可以通过一个小技巧实现。

现在让我们使用"系列的意思"替换缺失值函数的方法。

RMV /gender_1=SMEAN(gender).

由于性别变量的编码为0-1,因此此过程返回1的比例与0相比,缺少性别并将其保存到变量gender_1中。在不遗漏性别的情况下,返回性别的价值。比例值也可以被视为性别具有值1的概率。现在您可以用bernoulli分布的随机数替换它们(使用存储在" gender_1"中的概率)。

* Where gender is missing, replace the value for the "probability" of gender=1 
* with a bernoulli distributed random number (0 or 1) given this probability.
DO IF MISSING(gender).
   COMPUTE gender_1 = RV.BERNOULLI(gender_1).
END IF.
EXECUTE.