初学者RapidMiner问题在这里。假设我已完成开发预测性kNN模型,例如交叉验证,我现在想用这个模型对我所使用的整个数据集(训练和测试集)做预测,这是怎么做到的?我尝试了以下内容:
然后每个对象的'标签'都包含在它自己的最近邻域中,所以如果k = 1,则预测误差= 0,这显然不应该发生。
答案 0 :(得分:1)
答案 1 :(得分:0)
你是对的,将模型应用于训练过的相同数据是错误的。通常情况下,谁会设置一个用于训练模型的部分数据,然后是另一部分(未参与培训)进行测试。
请记住,交叉验证通常不是培训的一部分,而是一种确保模型稳定且不会过度训练所呈现数据的方法。
我建议您查看applying,testing和validating上的RapidMiner教程视频。
中进一步询问或重新发帖