我正在寻找一个python / sklearn / lifelines / Harrell's c-index
(一致性索引)的任何实现,random survival forests中提到了这一点。
使用以下步骤计算C指数:
Ti=Tj
,则忽略对i和j,除非至少有一个是死亡。让Permissible
表示允许对的总数。Ti
和Tj
不相等的每个允许对,如果生存期较短,则计为1
时间预测结果更差;如果预测结果相关,则计算0.5。对于每个允许的对,Ti=Tj
并且两者都是死亡,如果预测结果是并列的,则计数为1;否则,算0.5。对于每个允许的
配对Ti=Tj
,但不是两者都是死亡,如果死亡,则计为1
预测结果更差;否则,算0.5。让Concordance表示
所有允许对的总和。C
由C=Concordance/Permissible
定义。注意:nltk
的{{1}}方法具有不同的含义:(
答案 0 :(得分:3)
LifeLines包现已实现c-index, or concordance-index
答案 1 :(得分:0)
LifeLine包可以实现一致性索引。
pip install lifelines
或
conda install -c conda-forge lifelines
示例:
from lifelines.utils import concordance_index
cph = CoxPHFitter().fit(df, 'T', 'E')
concordance_index(df['T'], -cph.predict_partial_hazard(df), df['E'])