如何在新的x值上使用线性回归模型预测y值

时间:2018-12-06 21:22:59

标签: r linear-regression forecasting stress-testing

我有一个多元线性回归模型:

model <- lm(y ~ a + b + c, data = df)

让我们说 y a b c 的历史时期是2000年以来的季度数据-2017。

Date    y    a    b    c
2000Q1  2    1.5  1.3  8.1
2000Q2  2.3  1.8  1.2  7.6
.       .    .    .    .
.       .    .    .    .
.       .    .    .    .
.       .    .    .    .
2017Q4  8.7  3.5  5.6  3.2

现在有了线性模型,我想通过使用 a b 的新数据来预测 y c ,其期限为2017年至2020年,我们将其称为 a2 b2 c2

Date    a2   b2   c2
2017Q4  3.5  5.6  3.2
2018Q1  4.1  6.3  3.0
.       .    .    .
.       .    .    .
.       .    .    .
2020Q4  5.6  7.8  2.2

如何使用以前的历史/实际数据( a b c )中的线性模型,以及预测x的较新值 y a2 b2 c2 )?

我已经尝试使用predict()和predict.lm()函数,但是没有任何结果给我我想要的结果。我可以手动输入线性模型并创建这些预测,但是我敢肯定有一种更有效的方法。

更新资料

这是我在做什么的一个小例子:

df <- data.frame(y = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10),
                 a = c(2, 2.3, 2.6, 2.9, 2.4, 2.6, 3.0, 3.2, 3.9, 3.7),
                 b = c(9, 8.7, 9.1, 7.8, 8.2, 8, 6.9, 7.8, 9.1, 5.7))

attach(df)

model <- lm(y ~ a + b)

df2 <- data.frame(a2 = c(3.7, 4.0, 5.2, 5.6, 5.8, 6),
              b2 = c(5.7, 5.5, 5.3, 5.1, 4.9, 4.7))

predict(model, newdata = df2)

我不断收到警告消息的常规模型结果:

1         2         3         4         5         6         7         8         
9        10 
 1.409122  2.807886  3.690647  5.826560  3.569001  4.501510  6.882534  
7.004180  8.793667 10.514892 
Warning message:
'newdata' had 6 rows but variables found have 10 rows 

1 个答案:

答案 0 :(得分:1)

已更新,以匹配添加的示例

新数据中的名称必须与旧数据/线性模型中的名称匹配。

使用更新的示例,在运行预测之前,使df2中的名称与df中的名称匹配。

names(df2) = c("a","b")
predict(model, newdata = df2)