我的数据看起来像这样,多年来有许多物种的时间序列数据。
Species year x
species1 2000 56
species1 2001 12
species1 2002 40
species2 2000 30
species2 2001 40
species2 2002 50
对于每个物种,我想创建一个x与年份的回归模型,我还想绘制每个模型并找到每个趋势线的斜率。为此,我怀疑我应该使用某种类型的循环。
答案 0 :(得分:1)
假设您刚刚使用lm
,其诀窍是将数据参数更改为子集为不同的东西。
speciesList <- unique(df$Species)
for(i in 1:length(speciesList){
lmmodel <- lm(x ~ year, data = subset(df, Species == speciesList[i]))
#Now do all the stuff you want with lmmodel, e.g. plot, find slope, etc
}
我不会为你编写一整段功能代码,但这是一个棘手的问题。有关如何从模型中绘制数据的大量资源,包括趋势线等。
使用subset
函数可以让我们一次拉出一个物种的子集。我使用unique
得到了物种列表,然后逐个元素逐步执行该元素。
我也不确定x
或year
是否是您的自变量,所以我做出了逻辑假设year
。
答案 1 :(得分:0)
这是一个没有循环的解决方案。
# some artificial data
set.seed(1)
daf <- data.frame(species = factor(paste0("species", c(rep(1:3, 10)))),
year = rep(2000:2009, 3), x = sample(1:100, 30))
library(dplyr)
library(broom)
lm_fit <- daf %>% group_by(species) %>%
do(fit = lm(x ~ year, .))
tidy(lm_fit, fit) # or as.data.frame(tidy(lm_fit, fit)) to get a data.frame
# # A tibble: 6 x 6
# # Groups: species [3]
# species term estimate std.error statistic p.value
# <fct> <chr> <dbl> <dbl> <dbl> <dbl>
# 1 species1 (Intercept) 2508 7132 0.352 0.734
# 2 species1 year - 1.23 3.56 -0.346 0.738
# 3 species2 (Intercept) -11250 4128 -2.73 0.0260
# 4 species2 year 5.64 2.06 2.74 0.0256
# 5 species3 (Intercept) 461 7460 0.0618 0.952
# 6 species3 year - 0.206 3.72 -0.0554 0.957
library(ggplot2)
ggplot(daf, aes(x = year, y = x)) + geom_smooth(method = "lm", se = FALSE) +
facet_wrap(~species)