循环应用审查数据回归模型:维数错误

时间:2018-11-30 19:26:16

标签: r for-loop regression lapply

我正在将回归模型应用于一个较大的Tribble,并收到有关尺寸错误的错误。

y [,ny]错误:尺寸错误

我已经使用以下方法在整个数据集上成功运行了模型:

res <- survreg(Surv(left_clarity, right_clarity, type = 'interval2') ~ y + m + flow, data = tb_cens, dist = 'gaussian')

但是,当我尝试按完整数据集中的组进行分析时,它失败了。我已经尝试过一个循环,la脚和嵌套。所有人都给出相同的错误,因此无论哪里出错,至少是一致的。

我正在使用的循环语法是:

for (i in seq_along(stream_list[])) {
  id <- tb_cens$sys_loc_code == stream_list[i]
  model <- survreg(Surv(left_clarity[i], right_clarity[i], type = 'interval2') ~ y[i] + m[i] + flow[i], data = tb_cens, dist = 'gaussian')
 rep = 'a', correct = TRUE)
  pvalue[i] <- summary(model) ; 1 - pchisq(s$chi, (s$df-s$idf))
  slope[i] <- model$coefficients[2]
}

我尝试过的最糟糕的方法是:

list_of_streams_df <- split(tb_cens, tb_cens$sys_loc_code)
result1 <- lapply(list_of_streams_df, function(tb_cens) survreg(Surv(left_clarity, right_clarity, type = 'interval2') ~ y + m + flow, tb_cens, dist = 'gaussian') 
result2 <- lapply(result, summary)

当我拆分的组根据记录长度而不是变量数变化时,出现维数错误似乎很奇怪。

很抱歉,没有提供测试数据集,但是引发错误的数据大小相当难以控制。

任何想法都将受到欢迎。

0 个答案:

没有答案