数据

Question

上下文

我有12项风险评估，其中个人被评为0-4（4为最高风险）。风险评估可以针对每个人进行多次（最大值= 19，但大多数只有少于5次测量）。风险的基线水平因个人而异，因此我正在寻找随机截距模型，但也需要反映风险的动态性质，即将“时间”作为随机系数加入。

结果是二元的：

进一步冒犯 （FO.bin），这种情况发生在测量级别，这意味着我基本上在查看一个或多个内部发生的动态变化12个项目以及它们如何在测量之间的时间内为个人犯下进一步的罪行做出贡献

最终，我基本上要做的是根据其他人（具有相同特征的）评估历史，背景因素和可能随时间变化的因素来预测个人是否会在未来冒犯。

目标：

我希望通过添加时变（级别1）和时间不变（级别2）预测变量来添加到我的“基本”模型中：

时差包括刑事司法程序的虚拟变量，例如不遵守规定，上法庭和在拘留期间。这些反映为在评估之间发生的“事件”
时间不变包括虚拟变量，例如女性，非白人，以及连续预测因素，例如首次犯罪时的年龄我已经设法使用lmer4进行设置，并且通过添加1级和2级预测器（包括存在交互和交叉交互的位置）可以获得一些可能有趣的结果。然而，增强模型的复杂性抛出了各种警告信息，包括未能收敛的警告信息。因此，我认为使用Rjags切换到贝叶斯框架是合适的，这样我就可以对我的发现更有信心。

问题：

基本上它是翻译之一。这是我基于时间的“基本”模型和使用lme4的风险评估中的12个项目：

Basic_Model1 <- glmer(BinaryResponse ~ item1 + item2 + item3 + ... + item12 + time + (1+time|individual), data=data, family=binomial)

这是我尝试将其转换为BUGS模型：

# the number of Risk Assessments = 552
N <-nrow(data)                                                            

# number of Individuals (individual previously specified) = 88
J <- length(unique(Individual))                                           

# the 12 items (previously specified)
Z <- cbind(item1, item2, item3, item4, ... item12)                        

# number of columns = number of predictors, will increase as model enhanced
K <- ncol(Z)                                                              

## Store all data needed for the model in a list

jags.data1 <- list(y = FO.bin, Individual =Individual, time=time, Z=Z, N=N, J=J, K=K)                    

model1 <- function() {
    for (i in 1:N) {
    y[i] ~ dbern(p[i])
    logit(p[i]) <- a[Individual[i]] + b*time[i] 
  }
  
  for (j in 1:J) {
    a[j] ~ dnorm(a.hat[j],tau.a)
    a.hat[j]<-mu.a + inprod(g[],Z[j,])
  }
  b ~ dnorm(0,.0001)
  tau.a<-pow(sigma.a,-2)
  sigma.a ~ dunif(0,100)
  
  mu.a ~ dnorm (0,.0001)
  for(k in 1:K) {
    g[k]~dnorm(0,.0001)
  }
}

write.model(model1, "Model_1.bug")

看看输出，我的直觉是我没有添加变化的时间系数，到目前为止我所做的只是相当于

Basic_Model2 <- glmer(BinaryResponse ~ item1 + item2 + item3 + ... + item12 + time + (1|individual), data=data, family=binomial)

如何调整我的BUGS代码以将时间反映为变化的系数，即Basic_Model1？

基于我设法找到的示例，我知道我需要在J循环中制作一个额外的规范，以便我可以监视U [j]，并且需要更改第二部分logit声明涉及时间，但它到了我看不见树木的地步！

我希望有比我更多专业知识的人能指出我正确的方向。最后，我希望通过添加额外的1级和2级预测变量来扩展模型。在使用lme4查看这些内容之后，我预计必须指定交互式跨层交互，因此我正在寻找一种足够灵活的方法来以这种方式进行扩展。我对编码很新，所以请温柔地对待我！

Answer 1

对于这种情况，您可以使用自回归高斯模型（CAR）。由于您的标记是winbugs（或openbugs），因此您可以使用函数car.normal，如下所示。此代码需要适应您的数据集！

数据

y应该是一个矩阵，其中包含行中的观察值和列中的时间。如果每个i的时间不同，则只需输入NA个值您还需要定义时态过程的参数。这是具有权重的邻域矩阵。我很抱歉，但我并不完全记得如何创建它...对于第一阶段的自回归，这应该是这样的：

jags.data1 <- list(
    # Number of time points
    sumNumNeigh.tm = 14, 
    # Adjacency but I do not remember how it works
    adj.tm = c(2, 1, 3, 2, 4, 3, 5, 4, 6, 5, 7, 6, 8, 7), 
    # Number of neighbours to look at for order 1
    num.tm = c(1, 2, 2, 2, 2, 2, 2, 1),
    # Matrix of data ind / time
    y = FO.bin, 
    # You other parameters
    Individual =Individual, Z=Z, N=N, J=J, K=K)

模型

model1 <- function() {
    for (i in 1:N) {
      for (t in 1:T) {
    y[i,t] ~ dbern(p[i,t])
    # logit(p[i]) <- a[Individual[i]] + b*time[i] 
    logit(p[i,t]) <- a[Individual[i]] + b*U[t] 
  }}

  # intrinsic CAR prior on temporal random effects
  U[1:T] ~ car.normal(adj.tm[], weights.tm[], num.tm[], prec.nu)
  for(k in 1:sumNumNeigh.tm) {weights.tm[k] <- 1 }
  # prior on precison of temporal random effects
  prec.nu ~ dgamma(0.5, 0.0005)       
  # conditional variance of temporal random effects
  sigma2.nu <- 1/prec.nu                                


  for (j in 1:J) {
    a[j] ~ dnorm(a.hat[j],tau.a)
    a.hat[j]<-mu.a + inprod(g[],Z[j,])
  }
  b ~ dnorm(0,.0001)
  tau.a<-pow(sigma.a,-2)
  sigma.a ~ dunif(0,100)

  mu.a ~ dnorm (0,.0001)
  for(k in 1:K) {
    g[k]~dnorm(0,.0001)
  }
}

为了您的信息，使用JAGS，您需要使用dmnorm为自己编写CAR模型。

将glmer（二项式）转换为jag以包含相关的随机效果（时间）

1 个答案:

数据

模型