应用错误收集

时间：2013-11-24 18:36:56

标签： python scikit-learn

我有一个数据集，包括一个特征向量和一个目标 - 1.0或0.0（代表两个类）。如果我适合RandomForestRegressor并调用其predict函数，是否等同于使用RandomForestClassifier.predict_proba()？

换句话说，如果目标是1.0或0.0，RandomForestRegressor输出概率是什么？

我是这么认为的，我得到的结果也是如此，但我想得到第二个意见......

由于黄鼠狼

答案 0 :(得分：4)

基于所解决的不同任务，这些之间存在重大的概念差异：

回归：连续（实值）目标变量。

分类：离散目标变量（类）。

对于一般分类方法，可能未定义术语probability of observation being class X，因为某些分类方法（例如knn）不处理概率。

然而对于随机森林（以及其他一些分类方法），分类被简化为类概率分解的回归。然后将预测类作为计算“概率”的argmax。在您的情况下，您输入相同的输入，您得到相同的结果。是的，可以将RandomForestRegressor返回的值视为概率。