可视化聚类结果

时间:2019-11-19 18:07:28

标签: machine-learning bigdata cluster-analysis k-means

使用k均值后,我有3个簇。 我已经在此数据集的k均值中使用了10个功能(标记)。

我了解我们无法绘制10D图表,但是我如何可视化这些簇?
我应该按2或3个要素(而不是10个)分隔数据吗? 在我的情况下应该使用哪些轴?

对于绘图,我在客户端使用js和highcharts.js。

代码示例(仅用于stackoverflow要求),但每个点都有10个坐标

const kmeans = require('ml-kmeans');

let data = [[1, 1, 1, 1, 1], [1, 2, 1, 1, 1], [-1, -1, -1, 1, 1], [-1, -1, -1.5, 1, 1]];

let centers = [[1, 2, 1, 1, 1], [-1, -1, -1, 1, 1]];


let ans = kmeans(data, 2, { initialization: centers });

console.log(ans);

/*KMeansResult*/

{
  clusters: [ 0, 0, 1, 1, 1 ] 

  centroids: 
   [ { centroid: [ 1, 1.5, 1, 1, 1 ], error: 0.25, size: 2 },
     { centroid: [ -1, -1, -1.25, 1, 1 ], error: 0.0625, size: 2 } ],
  converged: true, iterations: 1
}
*/*

1 个答案:

答案 0 :(得分:0)

使用您喜欢的通用可视化方法。群集没有特别的要求。

例如

  • 散点图矩阵
  • 使用PCA降低尺寸
  • tSNE嵌入
  • MDS
  • UMAP
  • 箱线图
  • 小提琴情节
  • ...