创建RapidMiner子流程以减少重复

时间:2015-02-27 16:26:53

标签: rapidminer

我是RapidMiner的新手,但我正在使用它来进行一些文本挖掘,并且可能是一个简单的问题,我似乎无法在任何地方找到答案。

我正在从数据库中将一些数据提取到RapidMiner中。从那里,我使用attribute_value_filter过滤数据,从原始数据中获取几个子集。

在准备好所有子集之后,我需要对每个子集执行完全相同的操作(提取一列数据,创建文档,标记化,词干化,删除停用词等)。

有没有办法在RapidMiner中创建一个“函数”,所以我不必为每个数据子集复制完全相同的操作集?我尝试过使用子进程运算符,但我似乎无法为每个独立的输入获得独立的输出。也许我没有正确设置它?我没有足够的声望点来发布我的流程图片,但如果需要更多详细信息,请告诉我。

非常感谢任何反馈!

1 个答案:

答案 0 :(得分:1)

Execute Process运算符是一个很好用的运算符。这允许创建以模块化方式使用的进程库。

我的博客here上有一个例子。