我有一个数据集,其中的变量代表得分和特征(两个计数的定性和定量组合)。我想根据每个分数聚集特征(而不是个体观察)。所以,我想形成在score_1的基础上相似的特征集群(trait_1到trait_15),然后重复分数2和3.下面的数据结构示例。
我在想我可以使用ClustOfVar包来形成这些集群,如果我只是试图将所有变量集群到类似的组中,我会理解。但是,我不知道如何根据其他变量之一对它们进行聚类。
如果有人有建议,我会很感激。提前谢谢。
Score_1 Score_2 Score_3 Trait_1 Trait_2 Trait_3 … Trait_15
N1
N2
N3
...
n100000
答案 0 :(得分:0)
您可能需要查看子空间群集算法。
它们通常允许重叠群集,因此您可能会获得相当多的群集。
您只对特征进行聚类,然后检查找到的聚类是否与第二阶段的已知分数相对应。