我想知道XGBC分类器对每个预测的信心。是否有可能拥有这样的价值?或者predict_proba间接是模型的信心吗?
答案 0 :(得分:4)
你的直觉确实是正确的:predict_proba
返回每个例子属于给定类的概率;来自docs:
predict_proba
( data,output_margin = False,ntree_limit = 0 )预测每个数据示例属于给定类的概率。
这个概率反过来经常被解释为在实践中作为预测的置信度。
尽管如此,这是一种临时的,实用的解释,它与p值或任何其他统计严谨度无关;一般来说,AFAIK,这种(和类似的)机器学习技术没有这样的措施。
在更一般的层面上,您可能有兴趣知道p值本身已迅速脱离统计学家的恩典;一些快速链接:
The ASA's Statement on p-Values: Context, Process, and Purpose(美国统计员)
The problems with p-values are not just with p-values(Andrew Gelman @美国统计员)
The problem with p-values(走向数据科学博客文章)