python中的索引索引

时间:2016-07-13 14:44:38

标签: python numpy scikit-learn survival-analysis

我正在寻找一个python / sklearn / lifelines / Harrell's c-index(一致性索引)的任何实现,random survival forests中提到了这一点。

使用以下步骤计算C指数:

  1. 在数据上形成所有可能的案例对。
  2. 省略那些生存时间较短被检查的对。如果Ti=Tj,则忽略对i和j,除非至少有一个是死亡。让Permissible表示允许对的总数。
  3. 对于TiTj不相等的每个允许对,如果生存期较短,则计为1 时间预测结果更差;如果预测结果相关,则计算0.5。对于每个允许的对,Ti=Tj并且两者都是死亡,如果预测结果是并列的,则计数为1;否则,算0.5。对于每个允许的 配对Ti=Tj,但不是两者都是死亡,如果死亡,则计为1 预测结果更差;否则,算0.5。让Concordance表示 所有允许对的总和。
  4. C-index CC=Concordance/Permissible定义。
  5. 注意:nltk的{​​{1}}方法具有不同的含义:(

2 个答案:

答案 0 :(得分:3)

LifeLines包现已实现c-index, or concordance-index

答案 1 :(得分:0)

LifeLine包可以实现一致性索引。

pip install lifelines

conda install -c conda-forge lifelines

示例:

from lifelines.utils import concordance_index
cph = CoxPHFitter().fit(df, 'T', 'E')
concordance_index(df['T'], -cph.predict_partial_hazard(df), df['E'])