针对单一结果变量的聚类变量 - ClustOfVar

时间:2012-09-14 19:21:24

标签: r cluster-analysis

我有一个数据集,其中的变量代表得分和特征(两个计数的定性和定量组合)。我想根据每个分数聚集特征(而不是个体观察)。所以,我想形成在score_1的基础上相似的特征集群(trait_1到trait_15),然后重复分数2和3.下面的数据结构示例。

我在想我可以使用ClustOfVar包来形成这些集群,如果我只是试图将所有变量集群到类似的组中,我会理解。但是,我不知道如何根据其他变量之一对它们进行聚类。

如果有人有建议,我会很感激。提前谢谢。

Score_1 Score_2 Score_3 Trait_1 Trait_2 Trait_3 …   Trait_15

N1
N2
N3
...
n100000

1 个答案:

答案 0 :(得分:0)

您可能需要查看子空间群集算法。

它们通常允许重叠群集,因此您可能会获得相当多的群集。

您只对特征进行聚类,然后检查找到的聚类是否与第二阶段的已知分数相对应。