混合数据集群的可视化

时间:2018-03-27 16:04:16

标签: r ggplot2 cluster-analysis data-visualization euclidean-distance

所以,我正在使用混合数据的模糊聚类。然后我想为集群结果做可视化。 这是我的数据

> head(x)
x1 x2        x3       x4
A  C    8.461373 27.62996
B  C   10.962334 27.22474
A  C    9.452127 27.57246
B  D    8.196687 27.29332
A  D    8.961367 26.72793
B  C    8.009029 27.97227

我按照这一步https://www.r-bloggers.com/clustering-mixed-data-types-in-r/

gower_dist <- daisy(x,
                 metric = "gower")
                 #type = list(logratio = 1))
tsne_obj <- Rtsne(gower_dist1, dims=2 ,is_distance = TRUE)
tsne_data = data.frame(tsne_obj1$Y, factor(g1$clusters))
colnames(tsne_data1)[3] = "cluster"


ggplot(aes(x = X1, y = X2), data = tsne_data1) +
geom_point(aes(color = cluster))

基于该网站,第一步使用Gower距离(我猜)转换数据,然后应用R-tsne。

所以我的问题是: 使用Rtsne进行混合数据是否很好(作为代表点)?我怀疑,在Gower距离的第一步,它就像强制你的分类数据是数字数据。

但令我惊讶的是,我的方法总是比基于情节的经典方法给出更好的结果。所以这对我更好地了解这一点很重要,我可以使用该图作为衡量聚类结果良好性的工具吗?因为根据情节,确定哪种方法更好(通过绘制聚类结果)并不困难,我给出下面的情节图,我真的很感动。

经典方法

enter image description here

我的方法

enter image description here

0 个答案:

没有答案