面对缺失数据时不会丢失观察结果

时间:2018-03-08 21:52:33

标签: r

我有一个数据集,我已经拟合了一个线性模型,我试图在这个线性模型上使用阶跃函数。我收到一条错误消息“说使用的行数已更改:删除缺失值?”。

我注意到我的数据集中的一些观察结果(不是很多)具有一个变量的NA值。我已经看到类似的问题建议使用na.omit(),但是当我这样做时,我失去了观察结果。但是我想保留观察结果,因为它们包含其他变量的有用信息。有没有办法使用步骤避免丢失观察结果?

2 个答案:

答案 0 :(得分:1)

您可以调用nobs函数来检查观察数量是否保持不变,以及use.fallback参数可能会猜测缺失值。但是,R文档建议在运行step之前省略相关数据。

答案 1 :(得分:0)

如果确实遗漏了缺失值,我会劝阻你简单地省略缺失值。您可以通过Amelia使用多次插补来估算数据,以便您拥有完整的数据集。

见这里:https://cran.r-project.org/web/packages/Amelia/Amelia.pdf 我也建议你阅读R. Little和D.B.的“缺失数据的统计分析”一书。鲁宾。