上下文
我有12项风险评估,其中个人被评为0-4(4为最高风险)。风险评估可以针对每个人进行多次(最大值= 19,但大多数只有少于5次测量)。 风险的基线水平因个人而异,因此我正在寻找随机截距模型,但也需要反映风险的动态性质,即将“时间”作为随机系数加入。
结果是二元的:
最终,我基本上要做的是根据其他人(具有相同特征的)评估历史,背景因素和可能随时间变化的因素来预测个人是否会在未来冒犯。
目标:
我希望通过添加时变(级别1)和时间不变(级别2)预测变量来添加到我的“基本”模型中:
时差包括刑事司法程序的虚拟变量,例如不遵守规定,上法庭和在拘留期间。这些反映为在评估之间发生的“事件”
时间不变包括虚拟变量,例如女性,非白人,以及连续预测因素,例如首次犯罪时的年龄 我已经设法使用lmer4进行设置,并且通过添加1级和2级预测器(包括存在交互和交叉交互的位置)可以获得一些可能有趣的结果。然而,增强模型的复杂性抛出了各种警告信息,包括未能收敛的警告信息。因此,我认为使用Rjags切换到贝叶斯框架是合适的,这样我就可以对我的发现更有信心。
问题:
基本上它是翻译之一。这是我基于时间的“基本”模型和使用lme4的风险评估中的12个项目:
Basic_Model1 <- glmer(BinaryResponse ~ item1 + item2 + item3 + ... + item12 + time + (1+time|individual), data=data, family=binomial)
这是我尝试将其转换为BUGS模型:
# the number of Risk Assessments = 552
N <-nrow(data)
# number of Individuals (individual previously specified) = 88
J <- length(unique(Individual))
# the 12 items (previously specified)
Z <- cbind(item1, item2, item3, item4, ... item12)
# number of columns = number of predictors, will increase as model enhanced
K <- ncol(Z)
## Store all data needed for the model in a list
jags.data1 <- list(y = FO.bin, Individual =Individual, time=time, Z=Z, N=N, J=J, K=K)
model1 <- function() {
for (i in 1:N) {
y[i] ~ dbern(p[i])
logit(p[i]) <- a[Individual[i]] + b*time[i]
}
for (j in 1:J) {
a[j] ~ dnorm(a.hat[j],tau.a)
a.hat[j]<-mu.a + inprod(g[],Z[j,])
}
b ~ dnorm(0,.0001)
tau.a<-pow(sigma.a,-2)
sigma.a ~ dunif(0,100)
mu.a ~ dnorm (0,.0001)
for(k in 1:K) {
g[k]~dnorm(0,.0001)
}
}
write.model(model1, "Model_1.bug")
看看输出,我的直觉是我没有添加变化的时间系数,到目前为止我所做的只是相当于
Basic_Model2 <- glmer(BinaryResponse ~ item1 + item2 + item3 + ... + item12 + time + (1|individual), data=data, family=binomial)
如何调整我的BUGS代码以将时间反映为变化的系数,即Basic_Model1?
基于我设法找到的示例,我知道我需要在J循环中制作一个额外的规范,以便我可以监视U [j],并且需要更改第二部分logit声明涉及时间,但它到了我看不见树木的地步!
我希望有比我更多专业知识的人能指出我正确的方向。最后,我希望通过添加额外的1级和2级预测变量来扩展模型。在使用lme4查看这些内容之后,我预计必须指定交互式跨层交互,因此我正在寻找一种足够灵活的方法来以这种方式进行扩展。我对编码很新,所以请温柔地对待我!
答案 0 :(得分:1)
对于这种情况,您可以使用自回归高斯模型(CAR)。由于您的标记是winbugs(或openbugs),因此您可以使用函数car.normal
,如下所示。此代码需要适应您的数据集!
y
应该是一个矩阵,其中包含行中的观察值和列中的时间。如果每个i
的时间不同,则只需输入NA
个值
您还需要定义时态过程的参数。这是具有权重的邻域矩阵。我很抱歉,但我并不完全记得如何创建它...对于第一阶段的自回归,这应该是这样的:
jags.data1 <- list(
# Number of time points
sumNumNeigh.tm = 14,
# Adjacency but I do not remember how it works
adj.tm = c(2, 1, 3, 2, 4, 3, 5, 4, 6, 5, 7, 6, 8, 7),
# Number of neighbours to look at for order 1
num.tm = c(1, 2, 2, 2, 2, 2, 2, 1),
# Matrix of data ind / time
y = FO.bin,
# You other parameters
Individual =Individual, Z=Z, N=N, J=J, K=K)
model1 <- function() {
for (i in 1:N) {
for (t in 1:T) {
y[i,t] ~ dbern(p[i,t])
# logit(p[i]) <- a[Individual[i]] + b*time[i]
logit(p[i,t]) <- a[Individual[i]] + b*U[t]
}}
# intrinsic CAR prior on temporal random effects
U[1:T] ~ car.normal(adj.tm[], weights.tm[], num.tm[], prec.nu)
for(k in 1:sumNumNeigh.tm) {weights.tm[k] <- 1 }
# prior on precison of temporal random effects
prec.nu ~ dgamma(0.5, 0.0005)
# conditional variance of temporal random effects
sigma2.nu <- 1/prec.nu
for (j in 1:J) {
a[j] ~ dnorm(a.hat[j],tau.a)
a.hat[j]<-mu.a + inprod(g[],Z[j,])
}
b ~ dnorm(0,.0001)
tau.a<-pow(sigma.a,-2)
sigma.a ~ dunif(0,100)
mu.a ~ dnorm (0,.0001)
for(k in 1:K) {
g[k]~dnorm(0,.0001)
}
}
为了您的信息,使用JAGS,您需要使用dmnorm
为自己编写CAR模型。