如何使用RapidMiner计算集群中的“角色”实例

时间:2015-11-16 16:07:29

标签: weka rapidminer

我有一个RapidMiner流,它采用数据集并对其进行聚类。在输出中我可以看到我的角色,但我无法找到计算每个群集角色的方法。如何计算每个群集的角色数。我查看了Aggregate节点,但我的角色不是可用属性。

基本上,我试图弄清楚群集是否对该角色说了什么。我也使用Weka,他们称之为“Classes to clusters evaluation”。它基本上显示了每个集群的类(或角色)细分方式。

我当前的流程: enter image description here

只有两个属性可用。我的角色不是其中之一。 enter image description here

共有34个属性。我想通过ret_zpc聚合 enter image description here

1 个答案:

答案 0 :(得分:0)

RapidMiner具有角色的概念。属性可以是常规属性,标识,集群或标签(以及其他一些属性)。甚至还有一个允许更改角色的运算符Set Role。在RapidMiner之外,角色,标签和类可以互换使用。

对于您的问题,Aggregate运算符就是您所需要的。假设您的示例集中的角色为Cluster,另一个角色为Label,您可以选择这些属性作为要分组的属性。对于aggregation属性,选择另一个属性并选择count作为聚合函数。

在您的情况下,您想要的属性不会在下拉列表中填充,但仍然可以使用它们。您只需手动输入它们并明确地将它们添加到选择标准中。如果RapidMiner无法查看属性的任何元数据,则有时会发生属性缺失。如果您更改Read CSV运算符以使其具有显式映射,您应该会发现属性可供选择。