我有一个数据集,我先洗牌,然后将(k-fold)分区为数据帧,即训练集(67个观测值)和表示测试集的数据帧(10个观测值)。
如何使用训练集来预测测试集,从而在R中制作线性模型。并获得准确性或错误率?
答案 0 :(得分:1)
如果您显示数据的样子,那么回答会更容易。此外,通过在线搜索可以轻松回答这类问题。
要获得线性模型,线性回归是可行的方法。使用
model <- lm(formula = y ~ x1 + x2, data = trainData)
获得线性模型(假设您要预测的变量称为y,您的预测变量为x1和x2)。要预测测试数据,请使用:
predict(model, testData)
如何获得准确性取决于您是进行回归还是分类...对于回归,您可以使用预测结果和正确标签的向量来计算RMSE。要进行分类,您可以使用table()
和classAgreement()
。在R文档中阅读有关它们的更多信息(例如?table()
)。
我建议你在开始之前阅读更多有关R中线性回归的内容!例如:https://www.r-bloggers.com/linear-regression-using-r/