我对生存分析很陌生,所以我的问题对大多数人来说都是天真的,我道歉。
我有一些左右删失的遥测数据。
我首先要估计3个虚拟解释变量对生存的影响,所以我使用了Anderson-Gill模型(来自Cox模型的扩展)。在这里,危害是性别,研究区域(地区)和年龄等级的函数(年龄分为3个年龄组:小猫(0-1岁),一岁(1-2岁)和成人(超过2岁))。主要的“问题”是年龄类变量是一个依赖于时间的协变量。有些人在几年内被跟踪,因此在研究期间改变了年龄组。该模型的输出提供了我测试的每个变量对生存(性别,地区和年龄等级)的影响。我可以使用<body>
轻松预测生存(S(t)),并预测曲线代表其协变量与新数据中的值相对应的群组。
我的最终目标是估计每个队列(即来自北方地区的男性成年人)的平均年存活率,以便将这些估计值用作年龄结构矩阵群体模型的输入。我首先想到的是从survfit()
函数得到一个简单的生存估计平均值S(t)然后我意识到时间依赖的协变量似乎使估计更复杂。我甚至想知道是否可以用Cox模型估算每个队列的平均年存活率。也许年度Kaplan-Meier生存估计应该可行吗?是否可以从survfit()
获取它?
是否有人必须进行同样的分析? 以下是R代码,总结了我为估计每个协变量的影响所做的工作:
survfit()
答案 0 :(得分:0)
我认为这个问题应该可以转到Cross-Validated。但这是我的看法:你应该使用逻辑回归模型。一旦受试者存活了一段时间,他们就不会受到审查,但您发现失败并且他们在新的年龄重新进入该队列。它们不是独立的,除非生存过程是条件无记忆的(一个复杂的鞅属性与统计无关,因为它是一个不可能的测试假设)。您可以通过观察每个受试者的特定存活间隔来构建独立样本。将这些结果与作为独立数据处理每个受试者特定年龄 - 间隔的假概率进行比较,然后检查随机效应模型并验证随机截距的方差与固定效应的95%CI相比相对较小。