在Orange数据挖掘工具包中,如何指定用于交叉验证的组?

时间:2015-12-14 01:50:35

标签: machine-learning cross-validation orange

我正在使用Orange GUI,并尝试执行交叉验证。我的数据有8个不同的组(由输入数据中的变量指定),我喜欢每个折叠以支持不同的组。使用Orange可以做到这一点吗?我可以选择交叉验证的折叠数量,但我没有看到确定每个数据的方法。

1 个答案:

答案 0 :(得分:1)

交叉验证是随机抽样。我不认为你所寻求的是开箱即​​用的。

如果你真的想让它尊重你事先做出的分裂(根据一些输入变量),并且你不怕一些体力劳动,你可以使用 Select Rows 小部件选择一个组的行(即匹配数据),将其传递给 Test&将评分为测试数据,并将所有其余数据(即不匹配的数据)作为培训数据。这样,您就可以获得单个折叠(组)的交叉验证。重复,最后平均,以获得所有折叠的结果。

如果您了解一些Python,那么您可以使用Orange脚本层。