所以,我正在使用混合数据的模糊聚类。然后我想为集群结果做可视化。 这是我的数据
> head(x)
x1 x2 x3 x4
A C 8.461373 27.62996
B C 10.962334 27.22474
A C 9.452127 27.57246
B D 8.196687 27.29332
A D 8.961367 26.72793
B C 8.009029 27.97227
我按照这一步https://www.r-bloggers.com/clustering-mixed-data-types-in-r/
gower_dist <- daisy(x,
metric = "gower")
#type = list(logratio = 1))
tsne_obj <- Rtsne(gower_dist1, dims=2 ,is_distance = TRUE)
tsne_data = data.frame(tsne_obj1$Y, factor(g1$clusters))
colnames(tsne_data1)[3] = "cluster"
ggplot(aes(x = X1, y = X2), data = tsne_data1) +
geom_point(aes(color = cluster))
基于该网站,第一步使用Gower距离(我猜)转换数据,然后应用R-tsne。
所以我的问题是: 使用Rtsne进行混合数据是否很好(作为代表点)?我怀疑,在Gower距离的第一步,它就像强制你的分类数据是数字数据。
但令我惊讶的是,我的方法总是比基于情节的经典方法给出更好的结果。所以这对我更好地了解这一点很重要,我可以使用该图作为衡量聚类结果良好性的工具吗?因为根据情节,确定哪种方法更好(通过绘制聚类结果)并不困难,我给出下面的情节图,我真的很感动。
经典方法
我的方法