Question

我有一个数据集，其中的变量代表得分和特征（两个计数的定性和定量组合）。我想根据每个分数聚集特征（而不是个体观察）。所以，我想形成在score_1的基础上相似的特征集群（trait_1到trait_15），然后重复分数2和3.下面的数据结构示例。

我在想我可以使用ClustOfVar包来形成这些集群，如果我只是试图将所有变量集群到类似的组中，我会理解。但是，我不知道如何根据其他变量之一对它们进行聚类。

如果有人有建议，我会很感激。提前谢谢。

Score_1 Score_2 Score_3 Trait_1 Trait_2 Trait_3 …   Trait_15

N1
N2
N3
...
n100000

Answer 1

您可能需要查看子空间群集算法。

它们通常允许重叠群集，因此您可能会获得相当多的群集。

您只对特征进行聚类，然后检查找到的聚类是否与第二阶段的已知分数相对应。