如何在竞争风险随机森林中获得预测概率

时间:2018-03-06 22:38:57

标签: r random-forest survival-analysis

我想使用 randomForestSRC 来创建竞争风险模型(0个审查,1个感兴趣的事件,2个竞争事件)。我想在不同时间预测每个人对感兴趣事件的概率

概率是否与累积发病率函数(CIF)完全相同?

如果是这种情况,以下示例将给出概率

library(randomForestSRC)
data(wihs, package = "randomForestSRC")
wihs.obj <- rfsrc(Surv(time, status) ~ ., wihs, nsplit = 3, ntree = 100)

pred.obj = predict(wihs.obj)
probabilities = pred.obj$cif

并且给出CIF的相应兴趣时间存储在

pred.obj$time.interest

我想知道这些CIF是否实际上是该事件的可能性。

1 个答案:

答案 0 :(得分:1)

我们会向您推荐文档,特别是有关竞争风险的部分:

https://kogalur.github.io/randomForestSRC/theory.html#section8.2

产生了两个相关的集合:特定原因累积危险函数(cs-CHF)的估计值,以及特定原因累积发生率函数(cs-CIF)的估计值。事件j的预测值是综合的原因特异性cs-CIF。它可以被解释为预期的生命年数,并且是死亡率的衡量标准。

文档中包含了与特定定义的链接以及对现有理论的引用。