我是Mahout的新手,并使用K-Means开发数据挖掘集群用例。我需要帮助来了解如何将原始数据映射到群集输出以获得更多洞察力。让我们说
执行数据准备后,我们有一个具有以下属性的汇总数据集
Key1,Key2,Dimension1,Dimension2,Measure1,Measure2,Measure3
现在我已经对以下属性执行了聚类算法
Measure1,Measure2,Measure3
群集的输出将是Cluster Id及其数据(Measure1,Measure2,Measure3)。
问题: 如何对数据集中的特定属性执行群集,其中群集输出必须包含所有属性。
请求帮助我正确的方法。