所以我最近开始使用Weka,并且在使用例如J48构建树时有几个测试选项。以下是选项,包括我的未知选项:
我想知道的是训练集(第一个选项)到底是什么以及它做了什么。它从哪里获得这个训练集以及它准确测试了哪些数据?如果你能纠正我对其他人的理解,如果这是错的。
答案 0 :(得分:1)
第一个选项仅表示"使用加载的所有数据运行此算法"。你选择这个
答案 1 :(得分:1)
选项一是:
测试集=训练集
由此产生的分数当然容易过度拟合,这就是为什么它“非常乐观而且不一定有用”。