研究Scikit的CalibratedClassifierCV时,我注意到该对象需要在内存中keep multiple calibrated classifiers才能实时平均结果。
我知道这些分类器均已在部分数据集中进行过训练,以确保在分离的训练集上进行校准,这绝对是一个好主意。
保留3个分类器并放入袋中的不利之处在于,它降低了模型的可解释性,并增加了复杂性(可能还会增加计算时间)。
问题:校准曲线拟合后(无论是等渗曲线还是S型曲线),为什么原始分类器不能拟合到整个训练集上,并且校准曲线取平均值,有什么原因吗?