我正在尝试评估二元分层结构生态数据的时间序列中的自相关程度。我有11个年来每6个月在多个独立部位(n = 469)测量的生物存在或不存在(1或0)的数据(产生22个等距时间点)。
以下是一些可以使用的虚拟数据:
# Create dummy time series (random 0 or 1 value for absent or present)
# Format of time series is matrix with rows as sites and columns as time points
set.seed(1)
dat <- matrix(sample(0:1, 469*22, replace=T), nrow=469, ncol=22)
我想知道每个部位生物体存在/不存在的序列相关程度(时间= t对时间= t-1,t-2,t-3,...,t-21)。虽然数据是空间结构的,但我并不真正关心特定于网站的趋势,而只关注整体关系。有人可以帮我确定格式化数据的适当方式,以便在程序包中使用(例如“acf”)或设计用于处理此问题的自定义函数吗?
答案 0 :(得分:0)
这个怎么样?
set.seed(1)
dat <- data.frame(id=1:469,matrix(sample(0:1, 469*22, replace=T), nrow=469, ncol=22))
library(tidyr);library(dplyr)
dat %>%
gather(time,dummy,-id)->dat2
library(lme4)
model<-glmer(dummy~time+(1|id),dat2,family="binomial")
vcov(model) #variance-covariance matrix