我对R还是很陌生,我希望很好地可视化将36个变量划分为6个细分的368k客户的k均值细分。
为此,我认为我需要先对数据集进行MDS处理,然后再绘制它,但我似乎总是遇到同样的问题,即R无法分配该长度的矢量长度。
我一直在寻找其他方法,例如NMDS,但仍然提出类似的问题。想知道是否甚至可以将缩放值存储为矢量以外的其他值?
意识到,这可能太大了,无法可视化,甚至根本不值得这样做。
欢迎任何提示或指导。
我要使用的代码是:
d=dist(MyData, method = "euclidean")
这给了我“错误:无法分配大小为1.4 Mb的向量”消息
当时我打算使用以下代码来拟合和绘制图形:
fit=cmdscale(d,eig=TRUE, k=2)
p = ggplot(data.frame(MyData), aes(fit$points[,1], fit$points[,2], color = factor(Kmeans$cluster)))
p <- p + theme(axis.title.y = element_text(size = rel(1.5), angle = 90))
p <- p + theme(axis.title.x = element_text(size = rel(1.5), angle = 00))
p= p + theme(axis.text=element_text(size=16,angle=90),axis.title=element_text(size=20,face="bold")) + geom_point(size=4)
p= p + theme(legend.text = element_text(size = 14, colour = "black"))
p= p + theme(legend.title = element_text(size = 18, colour = "black"))
p= p + theme(legend.key.size = unit(1.5, "cm"))
p