应用错误收集

时间：2017-09-25 16:55:42

标签： rapidminer

初学者RapidMiner问题在这里。假设我已完成开发预测性kNN模型，例如交叉验证，我现在想用这个模型对我所使用的整个数据集（训练和测试集）做预测，这是怎么做到的？我尝试了以下内容：

然后每个对象的'标签'都包含在它自己的最近邻域中，所以如果k = 1，则预测误差= 0，这显然不应该发生。

答案 0 :(得分：1)

好的，可以通过提取“测试集”来完成。从内部交叉验证＆＃39;见下文：

因此，基本上整个数据集是使用交叉验证时的测试和训练集，并且预测也作为额外列包含在输出中，不确定它们是平均值还是仅仅是最新的迭代。

答案 1 :(得分：0)

你是对的，将模型应用于训练过的相同数据是错误的。通常情况下，谁会设置一个用于训练模型的部分数据，然后是另一部分（未参与培训）进行测试。

请记住，交叉验证通常不是培训的一部分，而是一种确保模型稳定且不会过度训练所呈现数据的方法。

我建议您查看applying，testing和validating上的RapidMiner教程视频。

中进一步询问或重新发帖