将kNN模型应用于RapidMiner中的整个数据集

时间:2017-09-25 16:55:42

标签: rapidminer

初学者RapidMiner问题在这里。假设我已完成开发预测性kNN模型,例如交叉验证,我现在想用这个模型对我所使用的整个数据集(训练和测试集)做预测,这是怎么做到的?我尝试了以下内容:

enter image description here

然后每个对象的'标签'都包含在它自己的最近邻域中,所以如果k = 1,则预测误差= 0,这显然不应该发生。

2 个答案:

答案 0 :(得分:1)

好的,可以通过提取“测试集”来完成。从内部交叉验证'见下文:

enter image description here

因此,基本上整个数据集是使用交叉验证时的测试和训练集,并且预测也作为额外列包含在输出中,不确定它们是平均值还是仅仅是最新的迭代。

答案 1 :(得分:0)

你是对的,将模型应用于训练过的相同数据是错误的。通常情况下,谁会设置一个用于训练模型的部分数据,然后是另一部分(未参与培训)进行测试。

请记住,交叉验证通常不是培训的一部分,而是一种确保模型稳定且不会过度训练所呈现数据的方法。

我建议您查看applyingtestingvalidating上的RapidMiner教程视频。

也可以在RapidMiner community forum

中进一步询问或重新发帖