使用RapidMiner设计集群过程

时间:2012-10-24 10:34:14

标签: classification cluster-analysis data-mining decision-tree rapidminer

我对机器学习或群集没有太多经验,所以我对如何解决这个问题感到有点失落。我感兴趣的数据包括4列,其中一列只是一个id。其他3包含数值数据,值> = 0.我需要的聚类实际上非常简单,我可以手工完成,但是后来它会变得不那么明确所以我想从正确的过程开始。我需要6个簇,它们依赖于3列(称为A,B和C),如下所示:

A    B    C        Cluster
---- ---- -------- -------
0    0    0        0
0    0    >0       1
0    >0   <=B      2
0    >0   >B       3
>0   any  <=(A+B)  4
>0   any  >(A+B)   5

在此阶段,这些群集将提供对数据的洞察,以便为进一步分析提供信息。

由于我对此很陌生,我还没有充分了解各种算法聚类,所以我真的不知道从哪里开始。任何人都可以建议使用合适的模型,或者我可以研究的一些模型。

2 个答案:

答案 0 :(得分:2)

对我来说是群集

相反,我想你想要一个简单的决策树分类

它应该已经在Rapidminer中可用。

答案 1 :(得分:0)

您可以使用“生成属性”运算符。

这会从现有属性创建新属性。

创建所有规则会比较烦人,但它们会像

一样

cluster:if(((A == 0)&amp;&amp;(B == 0)&amp;&amp;(C == 0)),1,0)