用单个点绘制每个簇(Kmeans Clustering)

时间:2018-06-11 03:54:08

标签: python plot cluster-analysis k-means mds

我将不同的文本聚类成15个聚类。

案文的格式如下:

"Oreo Biscuit is good"
"Healthy Breakfast
"Cars are fast"
....

我将文本转换为100维的Word2Vec。现在我有15个星团,我想绘制。

不是绘制所有点,而是想为每个簇绘制1个点,这样在图中将有15个点。我该怎么做?

思路:

1) Use the cluster centre to plot each cluster.

Is there any other way  (Converting all the Word2vecs in a cluster into 
Doc2vec) or 

Can Mds (Multi Dimensional Scaling) be used to plot the . 
clusters?

谢谢

1 个答案:

答案 0 :(得分:1)

您已经拥有每个文本的矢量表示。您还有这些文本的集群。您有以下非常简单的选项:

  1. 您只需使用某种降​​维机制来控制聚类中心点。 ( Pro :简单,缺点:没有关于每个群体的优点的信息)
  2. 您仍然绘制了群集质心,但这些时间差异可以使用一些气泡图添加为第三维,如图here所示。 ( Pro:包括均值和方差,缺点: K-mean太简单了)
  3. 我们可以应用一些谱聚类方法,然后在上面应用上述方法。