Question

我对机器学习或群集没有太多经验，所以我对如何解决这个问题感到有点失落。我感兴趣的数据包括4列，其中一列只是一个id。其他3包含数值数据，值> = 0.我需要的聚类实际上非常简单，我可以手工完成，但是后来它会变得不那么明确所以我想从正确的过程开始。我需要6个簇，它们依赖于3列（称为A，B和C），如下所示：

A    B    C        Cluster
---- ---- -------- -------
0    0    0        0
0    0    >0       1
0    >0   <=B      2
0    >0   >B       3
>0   any  <=(A+B)  4
>0   any  >(A+B)   5

在此阶段，这些群集将提供对数据的洞察，以便为进一步分析提供信息。

由于我对此很陌生，我还没有充分了解各种算法聚类，所以我真的不知道从哪里开始。任何人都可以建议使用合适的模型，或者我可以研究的一些模型。

Answer 1

不对我来说是群集。

相反，我想你想要一个简单的决策树分类。

它应该已经在Rapidminer中可用。

Answer 2

您可以使用“生成属性”运算符。

这会从现有属性创建新属性。

创建所有规则会比较烦人，但它们会像

一样

cluster：if（（（A == 0）＆amp;＆amp;（B == 0）＆amp;＆amp;（C == 0）），1,0）

使用RapidMiner设计集群过程

2 个答案: