在rapidminer中迭代X_validation运算符中的每个折叠?

时间:2014-09-13 06:59:07

标签: java machine-learning classification rapidminer text-classification

我通过在Java中集成Rapid miner在Rapid miner中执行文本分类任务。我正在使用10倍交叉验证(x_validation运算符)。我需要在每个折叠中访问测试/火车分裂中的样本吗?

我已经尝试了很多,但无法遍历每个折叠?我是Rapid矿工的新手,所以我被困在这里......

我感谢任何帮助(我没有足够的声誉来上传图片,但这是一个简单的10倍交叉验证过程,我通过java代码访问)...

Process process = new Process(new File(filePath));
        XValidation validation =(XValidation) process.getOperator("Validation");

        // how to do this step for each fold seperately as it may only be getting these operators only for first iteration/fold
        Operator naive_bayes = validation.getSubprocess(0).getOperatorByName("Naive Bayes"); 
        Operator apply_model = validation.getSubprocess(1).getOperatorByName("Apply Model");

        IOContainer container = process.run();

        IOObject train_data = naive_bayes_weka.getOutputPorts().getPortByIndex(0).getAnyDataOrNull();
        IOObject test_data = naive_bayes_weka.getInputPorts().getPortByIndex(1).getAnyDataOrNull();

1 个答案:

答案 0 :(得分:0)

在大多数情况下,您无需重建过程控制结构。只需在流程中添加“商店”操作员,然后在任何需要的地方重新加载内容。除非您不想修改用于您的流程的所有运算符类,否则无法直接访问中间结果。