我通过在Java中集成Rapid miner在Rapid miner中执行文本分类任务。我正在使用10倍交叉验证(x_validation运算符)。我需要在每个折叠中访问测试/火车分裂中的样本吗?
我已经尝试了很多,但无法遍历每个折叠?我是Rapid矿工的新手,所以我被困在这里......
我感谢任何帮助(我没有足够的声誉来上传图片,但这是一个简单的10倍交叉验证过程,我通过java代码访问)...
Process process = new Process(new File(filePath));
XValidation validation =(XValidation) process.getOperator("Validation");
// how to do this step for each fold seperately as it may only be getting these operators only for first iteration/fold
Operator naive_bayes = validation.getSubprocess(0).getOperatorByName("Naive Bayes");
Operator apply_model = validation.getSubprocess(1).getOperatorByName("Apply Model");
IOContainer container = process.run();
IOObject train_data = naive_bayes_weka.getOutputPorts().getPortByIndex(0).getAnyDataOrNull();
IOObject test_data = naive_bayes_weka.getInputPorts().getPortByIndex(1).getAnyDataOrNull();
答案 0 :(得分:0)
在大多数情况下,您无需重建过程控制结构。只需在流程中添加“商店”操作员,然后在任何需要的地方重新加载内容。除非您不想修改用于您的流程的所有运算符类,否则无法直接访问中间结果。