我想在coxph
模型的情况下将估计的风险比绘制为时间的函数,该模型具有基于样条项的时间相关系数。我使用函数tt
创建了与时间相关的系数,类似于直接来自?coxph
的此示例:
# Fit a time transform model using current age
cox = coxph(Surv(time, status) ~ ph.ecog + tt(age), data=lung,
tt=function(x,t,...) pspline(x + t/365.25))
调用survfit(cox)
会导致survfit
无法理解带有tt
字词(as described in 2011 by Terry Therneau)的模型的错误。
你可以使用cox$linear.predictors
提取线性预测器,但我需要以某种方式提取年龄,而不是简单地提取每个时间。因为tt
在事件时间拆分数据集,所以我不能只将输入数据框的列与coxph
输出匹配。另外,我真的想绘制估计函数本身,不只是观察数据点的预测。
此处有a related question涉及样条线,但它不涉及tt
。
我仍然坚持这一点。我一直在深入研究这个目标:
spline.obj = pspline(lung$age)
str(spline.obj)
# something that looks very useful, but I am not sure what it is
# cbase appears to be the cardinal knots
attr(spline.obj, "printfun")
function (coef, var, var2, df, history, cbase = c(43.3, 47.6,
51.9, 56.2, 60.5, 64.8, 69.1, 73.4, 77.7, 82, 86.3, 90.6))
{
test1 <- coxph.wtest(var, coef)$test
xmat <- cbind(1, cbase)
xsig <- coxph.wtest(var, xmat)$solve
cmat <- coxph.wtest(t(xmat) %*% xsig, t(xsig))$solve[2, ]
linear <- sum(cmat * coef)
lvar1 <- c(cmat %*% var %*% cmat)
lvar2 <- c(cmat %*% var2 %*% cmat)
test2 <- linear^2/lvar1
cmat <- rbind(c(linear, sqrt(lvar1), sqrt(lvar2), test2,
1, 1 - pchisq(test2, 1)), c(NA, NA, NA, test1 - test2,
df - 1, 1 - pchisq(test1 - test2, max(0.5, df - 1))))
dimnames(cmat) <- list(c("linear", "nonlin"), NULL)
nn <- nrow(history$thetas)
if (length(nn))
theta <- history$thetas[nn, 1]
else theta <- history$theta
list(coef = cmat, history = paste("Theta=", format(theta)))
}
所以,我有结,但我仍然不确定如何将coxph
系数与结合并以实际绘制函数。任何领导都非常感激。
答案 0 :(得分:4)
我认为您可以通过使用pspline
生成输入矩阵并将其乘以coxph
输出中的相关系数来生成所需内容。要获得HR,您需要使用指数。
即
output <- data.frame(Age = seq(min(lung$age) + min(lung$time) / 365.25,
max(lung$age + lung$time / 365.25),
0.01))
output$HR <- exp(pspline(output$Age) %*% cox$coefficients[-1] -
sum(cox$means[-1] * cox$coefficients[-1]))
library("ggplot2")
ggplot(output, aes(x = Age, y = HR)) + geom_line()
注意此处的年龄是感兴趣时的年龄(即基线年龄与自研究开始以来经过的时间的总和)。它必须使用指定的范围来匹配原始模型中的参数。它也可以使用x
使用x = TRUE
输出计算,如下所示:
cox <- coxph(Surv(time, status) ~ ph.ecog + tt(age), data=lung,
tt=function(x,t,...) pspline(x + t/365.25), x = TRUE)
index <- as.numeric(unlist(lapply(strsplit(rownames(cox$x), "\\."), "[", 1)))
ages <- lung$age[index]
output2 <- data.frame(Age = ages + cox$y[, 1] / 365.25,
HR = exp(cox$x[, -1] %*% cox$coefficients[-1] -
sum(cox$means[-1] * cox$coefficients[-1])))