如何创建一个循环,使R中的回归模型?

时间:2018-02-18 22:42:19

标签: r for-loop lm

我的数据看起来像这样,多年来有许多物种的时间序列数据。

Species    year  x
species1   2000  56
species1   2001  12
species1   2002  40
species2   2000  30
species2   2001  40
species2   2002  50

对于每个物种,我想创建一个x与年份的回归模型,我还想绘制每个模型并找到每个趋势线的斜率。为此,我怀疑我应该使用某种类型的循环。

2 个答案:

答案 0 :(得分:1)

假设您刚刚使用lm,其诀窍是将数据参数更改为子集为不同的东西。

speciesList <- unique(df$Species)

for(i in 1:length(speciesList){

    lmmodel <- lm(x ~ year, data = subset(df, Species == speciesList[i]))

    #Now do all the stuff you want with lmmodel, e.g. plot, find slope, etc
}

我不会为你编写一整段功能代码,但这是一个棘手的问题。有关如何从模型中绘制数据的大量资源,包括趋势线等。

使用subset函数可以让我们一次拉出一个物种的子集。我使用unique得到了物种列表,然后逐个元素逐步执行该元素。

我也不确定xyear是否是您的自变量,所以我做出了逻辑假设year

答案 1 :(得分:0)

这是一个没有循环的解决方案。

# some artificial data
set.seed(1)
daf <- data.frame(species = factor(paste0("species", c(rep(1:3, 10)))), 
                  year = rep(2000:2009, 3), x = sample(1:100, 30))

library(dplyr)
library(broom)

lm_fit <- daf %>% group_by(species) %>% 
  do(fit = lm(x ~ year, .))

tidy(lm_fit, fit) # or as.data.frame(tidy(lm_fit, fit)) to get a data.frame

# # A tibble: 6 x 6
# # Groups:   species [3]
# species  term          estimate std.error statistic p.value
# <fct>    <chr>            <dbl>     <dbl>     <dbl>   <dbl>
# 1 species1 (Intercept)   2508       7132       0.352   0.734 
# 2 species1 year        -    1.23       3.56   -0.346   0.738 
# 3 species2 (Intercept) -11250       4128      -2.73    0.0260
# 4 species2 year             5.64       2.06    2.74    0.0256
# 5 species3 (Intercept)    461       7460       0.0618  0.952 
# 6 species3 year        -    0.206      3.72   -0.0554  0.957 

library(ggplot2)
ggplot(daf, aes(x = year, y = x)) + geom_smooth(method = "lm", se = FALSE) +
  facet_wrap(~species)

enter image description here