R(GLM)将具有缺失值的连续变量分割为变量和缺失值的因子

时间:2015-08-21 14:37:12

标签: r glm missing-data

我想知道是否有人知道是否有办法将缺失值的连续变量变为连续变量和缺失等级的因子。基本上我希望GLM能够在不考虑NA的情况下使变量适合我,并且只为NA水平拟合一个单独的参数。

我尝试使用交互操作,但当然这会在模型中引入别名。

1 个答案:

答案 0 :(得分:0)

如果您提供了一个简单的示例代码,您将更容易理解您的问题 根据我的理解,您希望将一个变量的影响分解为两个不同的变量:一个用于有效数据,另一个用于NA。

但是,通常丢弃NAs意味着放弃整个观察(行)。因此,您无法将剩余的信息用于该观察(因此,无需向观察中添加有关NA的存在的信息。无论如何都将丢弃它)< / p>

现在我不知道您的数据和应用程序的具体细节,但如果您坚持引入一个新参数来指示具有NA的行,那么您可以做的是impute缺少的值,然后添加你的&#34; NAs参数&#34;。通过这种方式,您可以保留所有观察结果,并仍然为模型提供有关缺失值存在的其他信息 再说一遍,如果你真的要进行估算,你也应该问一下&#34; NAs参数&#34;仍然是有道理的;再次,取决于你的具体问题。

但做插补是一项敏感的设计决定。您应该小心在数据中引入其他信息。关于&#34; NA参数&#34;也可以这样说,除非你知道缺失值的潜在原因\。