绘制来自coxph对象的估计HR与时间相关系数和样条曲线

时间:2015-06-28 22:00:28

标签: r spline cox-regression

我想在coxph模型的情况下将估计的风险比绘制为时间的函数,该模型具有基于样条项的时间相关系数。我使用函数tt创建了与时间相关的系数,类似于直接来自?coxph的此示例:

# Fit a time transform model using current age
cox = coxph(Surv(time, status) ~ ph.ecog + tt(age), data=lung,
     tt=function(x,t,...) pspline(x + t/365.25))

调用survfit(cox)会导致survfit无法理解带有tt字词(as described in 2011 by Terry Therneau)的模型的错误。

你可以使用cox$linear.predictors提取线性预测器,但我需要以某种方式提取年龄,而不是简单地提取每个时间。因为tt在事件时间拆分数据集,所以我不能只将输入数据框的列与coxph输出匹配。另外,我真的想绘制估计函数本身,只是观察数据点的预测。

此处有a related question涉及样条线,但它不涉及tt

编辑(7/7)

我仍然坚持这一点。我一直在深入研究这个目标:

spline.obj = pspline(lung$age)
str(spline.obj)

# something that looks very useful, but I am not sure what it is
# cbase appears to be the cardinal knots
attr(spline.obj, "printfun")

function (coef, var, var2, df, history, cbase = c(43.3, 47.6, 
51.9, 56.2, 60.5, 64.8, 69.1, 73.4, 77.7, 82, 86.3, 90.6)) 
{
    test1 <- coxph.wtest(var, coef)$test
    xmat <- cbind(1, cbase)
    xsig <- coxph.wtest(var, xmat)$solve
    cmat <- coxph.wtest(t(xmat) %*% xsig, t(xsig))$solve[2, ]
    linear <- sum(cmat * coef)
    lvar1 <- c(cmat %*% var %*% cmat)
    lvar2 <- c(cmat %*% var2 %*% cmat)
    test2 <- linear^2/lvar1
    cmat <- rbind(c(linear, sqrt(lvar1), sqrt(lvar2), test2, 
        1, 1 - pchisq(test2, 1)), c(NA, NA, NA, test1 - test2, 
        df - 1, 1 - pchisq(test1 - test2, max(0.5, df - 1))))
    dimnames(cmat) <- list(c("linear", "nonlin"), NULL)
    nn <- nrow(history$thetas)
    if (length(nn)) 
        theta <- history$thetas[nn, 1]
    else theta <- history$theta
    list(coef = cmat, history = paste("Theta=", format(theta)))
}

所以,我有结,但我仍然不确定如何将coxph系数与结合并以实际绘制函数。任何领导都非常感激。

1 个答案:

答案 0 :(得分:4)

我认为您可以通过使用pspline生成输入矩阵并将其乘以coxph输出中的相关系数来生成所需内容。要获得HR,您需要使用指数。

output <- data.frame(Age = seq(min(lung$age) + min(lung$time) / 365.25,
                               max(lung$age + lung$time / 365.25),
                               0.01))
output$HR <- exp(pspline(output$Age) %*% cox$coefficients[-1] -
                 sum(cox$means[-1] * cox$coefficients[-1]))
library("ggplot2")
ggplot(output, aes(x = Age, y = HR)) + geom_line()

Plot of HR vs age

注意此处的年龄是感兴趣时的年龄(即基线年龄与自研究开始以来经过的时间的总和)。它必须使用指定的范围来匹配原始模型中的参数。它也可以使用x使用x = TRUE输出计算,如下所示:

cox <- coxph(Surv(time, status) ~ ph.ecog + tt(age), data=lung,
             tt=function(x,t,...) pspline(x + t/365.25), x = TRUE)
index <- as.numeric(unlist(lapply(strsplit(rownames(cox$x), "\\."), "[", 1)))
ages <- lung$age[index]
output2 <- data.frame(Age = ages + cox$y[, 1] / 365.25,
                      HR = exp(cox$x[, -1] %*% cox$coefficients[-1] -
                               sum(cox$means[-1] * cox$coefficients[-1])))