我正在对分类数据进行聚类分析,因此使用k模式方法。
我的数据形成偏好调查: 你觉得头发和眼睛怎么样?
受访者可以从固定(多选)4种可能性中获取答案。
因此,我得到假人,应用k模式,将群集附加回初始df,然后用pca将其绘制成2D。
我的代码如下:
let urlStringEncoded = messageString.addingPercentEncoding(withAllowedCharacters: .alphanumerics)
我可以想象:
现在我的问题是: 可以以某种方式揭示每个群集的显着特征吗? 也就是说,散点图中绿点组的主要特征(可能是金色的头发和蓝色的眼睛)是什么?
我发现群集已经发生,但我无法找到一种方法来翻译群集的实际含义。
我应该使用.labels_对象吗?
答案 0 :(得分:4)
看看km.cluster_centroids_
。这将为每个群集提供每个变量的模式。