培训的作用&构建决策树并使用它进行分类的测试集

时间:2011-02-17 20:16:42

标签: machine-learning weka decision-tree

我已经在weka工作了几个月了。 目前,我正在奥斯特福德大学学院学习机器学习课程。 我需要一种更好的方法来构建基于分离的训练和测试集的决策树。 任何提出好主意的人都可以获得非常大的帮助。 提前完成。

-Neo

2 个答案:

答案 0 :(得分:4)

你可能会要求更具体的东西,但总的来说:

使用训练集构建决策树,并使用测试集评估该树的性能。换句话说,在测试数据上,您调用一个通常命名为c * lassify *的函数,传入新构建的树和您希望分类的数据点(在您的测试集中)。

此函数从树中返回该数据点所属的叶子(终端)节点 - 并假设该叶子的内容是同质的(填充来自单个类的数据,而不是混合),那么您有本质为该数据点分配了一个类标签。当您将树指定的类标签与数据点的实际类标签进行比较,并对测试集中的所有实例重复时,您有一个度量来评估树的性能。

经验法则:随机播放您的数据,然后将90%分配给训练集,将另外10%分配给测试集。

答案 1 :(得分:0)

实际上我正在寻找类似的东西 - http://weka.wikispaces.com/Saving+and+loading+models 保存模型,加载它并在训练集中使用它。 这正是我在寻找的东西。希望它对我遇到类似问题的人有用。 干杯 -Neo182