我正在处理大型和稀疏数据集的问题。使用大众的逻辑回归预测是令人满意的。现在,为了提高系统性能,我需要能够说出概率预测的置信度得分或置信区间。 也就是说,即使两个数据样本具有相同的预测,置信度得分或区间也应该能够区分来自学识丰富的特征的预测与来自罕见特征的预测。 (请考虑变量是分类的,因此在VW设置中,每个变量值对都被视为特征。)
所以,有几个问题:
由于这是一个在线学习设置,是否有一种方法可以计算特征系数的标准误差?
我们可以使用大众汽车输出中的ssgrad
(sum of squared gradients in adaptive updates)作为this论文中提出的不确定性评分的等效替代方法吗? 不变更新和逼近来加速学习的任何实现是否会影响使用ssgrad
作为不确定性评分的目的?
欢迎任何建议,讨论和评论。