处理geepack R中的缺失值

时间:2018-04-24 14:52:10

标签: r missing-data

我有一个纵向数据集,包括前往诊所接受治疗的受试者。在每次访问时,记录了几个潜在的预测因子,并且每次访问都有一个二元结果,无论是有利还是不利的结果。

某些预测人员在某些访问中缺少数据,而在同一次访问中,其他预测人员拥有该访问的完整数据。

当我使用R中的geepack软件包运行gee模型时,它给了我一个错误,我发现它是导致错误的缺失数据,因为gee处理完整的数据。

但是,如果由于一个预测变量丢失而其他人完成而删除了一个观察,我丢弃了大量数据。这有解决方法吗?

1 个答案:

答案 0 :(得分:0)

如果您必须拥有完整数据,您可以尝试将其输入。一种流行的库/方法是'老鼠'。

你必须非常小心这种方法,因为,编造数据是一件非常重要的事情。特别是,现实世界的东西往往不是随意丢失的。也许极端值更有可能丢失,或者更有可能被记录。我的印象是,如何做到这一点仍然是一个开放的研究问题。

也许请查看此处的教程https://datascienceplus.com/imputing-missing-data-with-r-mice-package/或其链接的简化版本,看看这是否适用于您的案例,YMMV。