线性模型能否比随机森林,决策树,神经网络提供更高的预测精度?

时间:2017-07-29 08:43:56

标签: neural-network linear-regression random-forest decision-tree

在对来自kaggle

的数据集应用以下算法后,我计算了以下参数

enter image description here

在上述情况下,线性模型给出了最好的结果。 以上结果是否正确并且线性模型在任何情况下实际上都能比其他3更好的结果? 或者我错过了什么?

2 个答案:

答案 0 :(得分:0)

根据AUC标准,这种分类是完美的(1是理论最大值)。这意味着数据的明显差异。在这种情况下,谈论方法结果的差异是没有意义的。另一点是你可以使用方法参数(你可能会得到稍微不同的结果),其他方法可以变得更好。但真正的结果将无法区分。为复杂的数据发明了复杂的方法。事实并非如此。

答案 1 :(得分:0)

  

所有型号都错了,有些是有用的。 - 乔治盒子

就分类而言,只要模型能很好地符合分类边界,模型就会有效。

对于二元分类情况,假设您的数据完全可线性分离,那么线性模型将完成工作 - 实际上是最好的"因为任何更复杂的模型都不会表现得更好。

如果你的+和 - 在它们不能被一条线(实际上是超平面)分开时有点分散,那么线性模型可能会被决策树击败,因为决策树可以提供更复杂形状(立方体)的分类边界。

随机森林可能会击败决策树,因为随机森林的分类边界更加灵活。

然而,正如我们之前提到的,线性模型仍然有它的时间。