我是群集新手。在我一直在研究的项目中,我运行了几个测试变量的PCA。我提出了5个特征值大于1的因子/组件。我标准化了加载到这些组件上的变量,我现在正在聚类。根据Proc Cluster给我的结果(ccc,pseudo等),我确定我也想要5个集群。现在,我试图找出这5个集群中每个集群的“定义”特征,并检查它们的组成(种族,性别,年龄)组成这些集群。为此,我尝试将一个新变量合并到我的datset中,该变量为每个参与者(通过ID)分配1-5之间的数字,表示该参与者属于哪个群集。但是,我在互联网上找到的所有游戏只告诉我如何确定最佳的聚类数。我已经知道我想要多少个集群,我只需要创建这个变量来告诉我哪个参与者进入了什么集群。做这个的最好方式是什么?