我正在使用插入符号R包对二进制分类任务的各种预测模型进行比较,以预测性能(liftChart)和预测精度(校准图)。我发现了以下问题: 1.当观察次数很大或有各种竞争分类时,有时升力函数非常慢。另外我想知道是否可以手动定义校准曲线的切割。我有一个严重的不平衡模型(平均概率为5%),校准曲线函数假设均匀间隔切割。
答案 0 :(得分:1)
提升图对每个唯一概率值进行计算(很像ROC曲线),这就是为什么它很慢。
这两个选项目前都没有。您可以向github page添加两个问题。我现在已经相当淹没了,但这些改变不应该是一件大事(你也可以提供解决方案)。
最高