如何处理线性回归中的缺失值?

时间:2020-04-15 10:01:42

标签: r linear-regression missing-data

我有一个包含60个变量的数据框,并且所有变量都缺少值,以至于没有一行是完整的:

complete.cases(data)
  [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [28] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [55] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [82] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE
[109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[136] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

所以我想我不能使用线性回归来估算缺失值。知道如何处理它们以便执行线性回归吗?

1 个答案:

答案 0 :(得分:1)

处理缺失值可能包括:

  1. 最好省略大多数缺少观测值的变量。

  2. 忽略缺少值的行/观测值/个案。此策略被称为按列表删除或完整案例分析。如果缺失类型为MCAR(随机完全缺失),并且删除后仍然有足够大的样本,则这是一种可能性。

  3. 不同的插补技术:均值/中位数/众数替换,回归输入,期望最大化(EM),多次输入等。