我有一个数据集,包括一个特征向量和一个目标 - 1.0或0.0(代表两个类)。如果我适合RandomForestRegressor
并调用其predict
函数,是否等同于使用RandomForestClassifier.predict_proba()
?
换句话说,如果目标是1.0或0.0,RandomForestRegressor
输出概率是什么?
我是这么认为的,我得到的结果也是如此,但我想得到第二个意见......
由于 黄鼠狼
答案 0 :(得分:4)
基于所解决的不同任务,这些之间存在重大的概念差异:
回归:连续(实值)目标变量。
分类:离散目标变量(类)。
对于一般分类方法,可能未定义术语probability of observation being class X
,因为某些分类方法(例如knn
)不处理概率。
然而对于随机森林(以及其他一些分类方法),分类被简化为类概率分解的回归。然后将预测类作为计算“概率”的argmax。在您的情况下,您输入相同的输入,您得到相同的结果。是的,可以将RandomForestRegressor
返回的值视为概率。