我正在使用插入符号来训练数据集上的分类模型,从中我获取输出的类概率并将它们输入到另一组计算中。具体来说,我将原始数据的一个维度上的类概率相加,并使用它来计算描述模型拟合质量的最终摘要统计量。
我目前必须训练模型以最大化其他一些指标(我现在正在使用Kappa),但我真正想做的是编写一个summaryFunction以传递给trainControl,它将从开始封装整个计算 - 到结束。
问题是这个summaryFunction需要原始数据点,因为我必须沿着原始数据的维度聚集类概率,以便计算摘要统计量。 summaryFunction原型似乎没有以我能看到的任何方式提供数据本身。
这里有简单的解决方案吗?我想我可以让原始数据框全局并在summaryFunction中使用它的值,只要传递给summaryFunction的类概率和预测与原始数据集的数量和行顺序相同?
非常感谢!!