我对机器学习或群集没有太多经验,所以我对如何解决这个问题感到有点失落。我感兴趣的数据包括4列,其中一列只是一个id。其他3包含数值数据,值> = 0.我需要的聚类实际上非常简单,我可以手工完成,但是后来它会变得不那么明确所以我想从正确的过程开始。我需要6个簇,它们依赖于3列(称为A,B和C),如下所示:
A B C Cluster
---- ---- -------- -------
0 0 0 0
0 0 >0 1
0 >0 <=B 2
0 >0 >B 3
>0 any <=(A+B) 4
>0 any >(A+B) 5
在此阶段,这些群集将提供对数据的洞察,以便为进一步分析提供信息。
由于我对此很陌生,我还没有充分了解各种算法聚类,所以我真的不知道从哪里开始。任何人都可以建议使用合适的模型,或者我可以研究的一些模型。
答案 0 :(得分:2)
不对我来说是群集。
相反,我想你想要一个简单的决策树分类。
它应该已经在Rapidminer中可用。
答案 1 :(得分:0)
您可以使用“生成属性”运算符。
这会从现有属性创建新属性。
创建所有规则会比较烦人,但它们会像
一样cluster:if(((A == 0)&amp;&amp;(B == 0)&amp;&amp;(C == 0)),1,0)