逻辑回归缺失值

时间:2010-12-29 20:24:27

标签: statistics regression

我可以使用缺失值进行逻辑回归吗?

我有很多连续属性和一些分类属性,我可以将它们设置为用户缺失吗?它有用吗?

2 个答案:

答案 0 :(得分:1)

要进行回归分析,您需要为每个事件测量所有变量。也许另一种技术可以用于缺少属性,但不能用于回归。

顺便说一下,您应该尝试在https://stats.stackexchange.com/

上发布问题

HTH!

答案 1 :(得分:1)

大多数回归过程都需要完整的数据,但有多种方法可以处理缺失值。这是一个微妙的话题,所以我不会假装在这里给出一个完整的答案,并建议做一些关于这个主题的阅读。简而言之,但是:

  1. 永远不要删除观察以解决此问题。
  2. 总是允许删除变量,但就一个人的数据预算来说显然非常严重。
  3. 使用全局常量填充缺失值,例如非缺失的平均值或中位数,应该谨慎地进行(当缺失的比例非常低时)(如果有的话)。
  4. 使用基于其他自变量选择的值填充缺失值优先于上面的数字3。
  5. 要了解有关此主题的更多信息,请查找“插补”这一术语的信息,尤其是“单一插补”和“多重插补”,“随机丢失”和“随意丢失”。