显示k模式群集功能

时间:2017-01-24 11:56:54

标签: scikit-learn k-means categorical-data

我正在对分类数据进行聚类分析,因此使用k模式方法。

我的数据形成偏好调查: 你觉得头发和眼睛怎么样?

enter image description here

受访者可以从固定(多选)4种可能性中获取答案。

因此,我得到假人,应用k模式,将群集附加回初始df,然后用pca将其绘制成2D。

我的代码如下:

 let urlStringEncoded = messageString.addingPercentEncoding(withAllowedCharacters: .alphanumerics)

我可以想象:

enter image description here

现在我的问题是: 可以以某种方式揭示每个群集的显着特征吗? 也就是说,散点图中绿点组的主要特征(可能是金色的头发和蓝色的眼睛)是什么?

我发现群集已经发生,但我无法找到一种方法来翻译群集的实际含义。

我应该使用.labels_对象吗?

1 个答案:

答案 0 :(得分:4)

看看km.cluster_centroids_。这将为每个群集提供每个变量的模式。