我知道一些机器学习算法可以输出输入样本的预测标签的概率。
例如,给出具有三个可能标签的样本,可以通过一些概率学习算法输出概率元组(0.2,0.3,0.5),例如逻辑回归或概率估计树。然后输出具有最大概率的标签(此处为0.5)作为最终预测。
我的问题是,给定一个具有预测概率元组(0.3,0.4,0.3)的新样本,我如何定量地确定预测标签(这里是第二个标签)是否正确的可能性?
非常感谢
答案 0 :(得分:0)
(这个恕我直言的问题不属于这里。它确实属于统计栈交换)
答案非常简单:概率/可能性 - 不完全相同 - 是0.4
,这是非常低的。
如果你想进行一个小实验。构建/学习模型可以对一些实例进行分类,并将其与实际情况进行比较。另外总结了最可能标签的概率。您将看到概率总和与正确分类的实例的分数相匹配 或者:
您的模型错误
您的样本集是小