我们能否以与通过随机森林进行逻辑回归相同的方式获得概率?

时间:2016-12-14 17:49:53

标签: r random-forest logistic-regression

我有一个二进制0-1变量的数据结构(点击&购买;点击& not-purchase)对照属性的向量。我使用逻辑回归来获得购买的概率。如何使用随机森林获得相同的概率?是通过使用随机森林回归?或者是随机森林分类类型=' prob'在R中给出了分类变量的概率?

1 个答案:

答案 0 :(得分:0)

由于两种方法的结构不同,因此不会给出相同的结果。 Logistic回归由确定的线性规范给出,其中RF是来自多个独立/随机树的集体投票。如果两者都适当调整了规格和输入功能,则可以产生可比较的结果。以下是两者之间的主要区别:

  1. RF将提供更强大的适应噪声,异常值,过度拟合或多重共线性等,这是回归类型解决方案中常见的陷阱。基本上如果您不知道或者不想了解输入数据的最新信息,那么RF是一个良好的开端。

  2. 如果您熟悉数据以及如何正确指定等式,
  3. 逻辑回归将会很好。或者以某种方式想要设计拟合/预测的工作原理。 GLM规范的明确形式将允许您这样做。