将数据拆分为测试集和训练集

时间:2014-11-16 04:55:02

标签: rapidminer

我可以使用Rapidminer中的哪个操作员作为我的训练集制作一个袋子样本,并将剩余的数据用作我的测试集?

2 个答案:

答案 0 :(得分:1)

Split Data运算符是一种选择。这使得两个或更多示例集按照您希望的方式分割,您可以使用这些来执行所需的操作。包含培训和测试方面的替代方案是Split-Validation

答案 1 :(得分:1)

使用X-validation操作符。

将数据集附加到X-validation运算符,然后将运算符的输出附加到输出节点。

在此之后,双击它或点击右下角的小双蓝色窗口进入x-validation操作符。

进入操作员后,在数据的训练侧附加您想要创建的任何模型(对于此实例,我使用决策树模型),然后在测试侧,将应用模型操作符附加到性能操作员。最后将性能运算符附加到输出。

然后按播放。它应该工作。