使用RandomForestClassifier.predict_proba与RandomForestRegressor.predict

时间:2013-11-24 18:36:56

标签: python scikit-learn

我有一个数据集,包括一个特征向量和一个目标 - 1.0或0.0(代表两个类)。如果我适合RandomForestRegressor并调用其predict函数,是否等同于使用RandomForestClassifier.predict_proba()

换句话说,如果目标是1.0或0.0,RandomForestRegressor输出概率是什么?

我是这么认为的,我得到的结果也是如此,但我想得到第二个意见......

由于 黄鼠狼

1 个答案:

答案 0 :(得分:4)

基于所解决的不同任务,这些之间存在重大的概念差异:

回归:连续(实值)目标变量。

分类:离散目标变量(类)。

对于一般分类方法,可能未定义术语probability of observation being class X,因为某些分类方法(例如knn)不处理概率。

然而对于随机森林(以及其他一些分类方法),分类被简化为类概率分解的回归。然后将预测类作为计算“概率”的argmax。在您的情况下,您输入相同的输入,您得到相同的结果。是的,可以将RandomForestRegressor返回的值视为概率。