不同数据集上的线性回归拟合(增强)

时间:2020-12-31 02:23:02

标签: r dplyr regression

我只是想在使用 dplyr 和增强函数构建回归模型的不同数据集上计算预测(拟合值)。但是我不断收到错误。即使不使用 dplyr,增强函数似乎也只接受模型所建立的数据集。有什么解决方案可以解决吗?下面是我的尝试之一。谢谢。

data1 <- head(mtcars,20)

model <- mtcars %>%
  group_by(cyl) %>%
  do(fit = lm(wt ~ mpg, .),
     data = (.)) %>%
  augment(fit, data1)

1 个答案:

答案 0 :(得分:1)

augment 中使用 mutate 并在 map 中使用 augment 一次传递一个模型。

library(broom)
library(dplyr)
library(purrr)

mtcars %>%
  group_by(cyl) %>%
  do(fit = lm(wt ~ mpg, .),
     data = (.)) %>%
  ungroup() %>%
  mutate(col   = map(fit, augment, newdata = data1))

此外,由于 do 已被取代,您可以在 summarise 中拟合模型。

mtcars %>%
  group_by(cyl) %>%
  summarise(fit = list(lm(wt ~ mpg)), 
            data = list(cur_data())) %>%
  mutate(col   = map(fit, augment, newdata = data1))

#    cyl fit    data               col               
#  <dbl> <list> <list>             <list>            
#1     4 <lm>   <tibble [11 × 11]> <tibble [20 × 14]>
#2     6 <lm>   <tibble [7 × 11]>  <tibble [20 × 14]>
#3     8 <lm>   <tibble [14 × 11]> <tibble [20 × 14]>