我正在处理包含1200个属性和450个实例的supervied数据。 为了获得良好的准确性,我尝试了许多决策树,但是当ADtree(交替决策树)给我时,它们都没有给我最好的解决方案。
问题在于ADtree正在使用Boosting算法,而且从我的不足看,这些算法并不是那么好,因为它们会在火车和测试中造成重复的错误。
我的工作需要验证(通过交叉验证),我不确定我是否能够使用ADtree。
我的问题是:我可以使用这棵树吗?
答案 0 :(得分:2)
问题在于ADtree正在使用Boosting算法
ADtrees不是提升算法而是不使用提升。如果实现支持加权数据点,您可以将助推应用于ADtree。
从我未知的这些算法不太好,因为它们会导致火车和测试中的重复检查
您的理解是完全错误的,而且不是很准确。
我的工作需要验证(通过交叉验证),我不确定我是否能够使用ADtree。
如果您了解交叉验证以及您正在做什么,这显然会很好。问题永远不是“我可以在交叉验证中使用此模型”,但“交叉验证对我的数据有效吗?”
我的问题是:我可以使用这棵树吗?
是的,但在盲目尝试解决问题之前,您显然需要了解更多有关您正在做的事情。 Coursera has a fine online introduction。