我可以在监督数据上使用树吗?

时间:2013-12-23 12:39:38

标签: machine-learning decision-tree

我正在处理包含1200个属性和450个实例的supervied数据。 为了获得良好的准确性,我尝试了许多决策树,但是当ADtree(交替决策树)给我时,它们都没有给我最好的解决方案。

问题在于ADtree正在使用Boosting算法,而且从我的不足看,这些算法并不是那么好,因为它们会在火车和测试中造成重复的错误。

我的工作需要验证(通过交叉验证),我不确定我是否能够使用ADtree。

我的问题是:我可以使用这棵树吗?

1 个答案:

答案 0 :(得分:2)

  

问题在于ADtree正在使用Boosting算法

ADtrees不是提升算法而是不使用提升。如果实现支持加权数据点,您可以将助推应用于ADtree。

  

从我未知的这些算法不太好,因为它们会导致火车和测试中的重复检查

您的理解是完全错误的,而且不是很准确。

  

我的工作需要验证(通过交叉验证),我不确定我是否能够使用ADtree。

如果您了解交叉验证以及您正在做什么,这显然会很好。问题永远不是“我可以在交叉验证中使用此模型”,但“交叉验证对我的数据有效吗?”

  

我的问题是:我可以使用这棵树吗?

是的,但在盲目尝试解决问题之前,您显然需要了解更多有关您正在做的事情。 Coursera has a fine online introduction