机器学习中样本预测的可能性

时间:2017-06-05 04:24:49

标签: machine-learning scikit-learn decision-tree prediction

我知道一些机器学习算法可以输出输入样本的预测标签的概率。

例如,给出具有三个可能标签的样本,可以通过一些概率学习算法输出概率元组(0.2,0.3,0.5),例如逻辑回归或概率估计树。然后输出具有最大概率的标签(此处为0.5)作为最终预测。

我的问题是,给定一个具有预测概率元组(0.3,0.4,0.3)的新样本,我如何定量地确定预测标签(这里是第二个标签)是否正确的可能性?

非常感谢

1 个答案:

答案 0 :(得分:0)

(这个恕我直言的问题不属于这里。它确实属于统计栈交换)

答案非常简单:概率/可能性 - 不完全相同 - 是0.4,这是非常低的。

如果你想进行一个小实验。构建/学习模型可以对一些实例进行分类,并将其与实际情况进行比较。另外总结了最可能标签的概率。您将看到概率总和与正确分类的实例的分数相匹配 或者:

  1. 您的模型错误

  2. 您的样本集是小