我是一名学生,对任何与编码相关的知识都没有先验知识,但是我正在学习一个需要RStudio的模块,而现在我正在苦苦挣扎。
我的一项作业需要我们探索处理训练数据集和测试数据集(多行和多个变量)中缺失数据的方法,然后使用训练集创建线性模型lm
。然后,将带有predict
的{{1}}与newdata = test data一起使用以观察结果。我的任务是学习如何使用lm
来处理此任务,但是我处于死胡同。
我尝试使用以下方法通过MICE
来填充训练数据集的缺失数据:
MICE
然后我尝试使用train = read.csv("Train_Data.csv", na.strings=c("","NA"))
missingtraindata = mice(train, m=5, maxit = 5, method = 'pmm')
model = with(missingtraindata, lm(LOS~.- PatientID, data = train))
miceresults = pool(model)
summary(miceresults)
,但是它不起作用,因为它说mira / mipo不适用于predict()
。我根本不知道那是什么意思。
老实说,我不知道这些代码有什么用,我只是尝试应用笔记中关于predict()
的所有可用信息。我不知道这是否是您正确使用MICE来填充丢失的数据的方式,但是我花了一整天的时间进行研究和尝试,但这没有帮助。请帮助pppp!