R中非常大的数据集的多维缩放

时间:2018-09-13 14:05:51

标签: r k-means mds

我对R还是很陌生,我希望很好地可视化将36个变量划分为6个细分的368k客户的k均值细分。

为此,我认为我需要先对数据集进行MDS处理,然后再绘制它,但我似乎总是遇到同样的问题,即R无法分配该长度的矢量长度。

我一直在寻找其他方法,例如NMDS,但仍然提出类似的问题。想知道是否甚至可以将缩放值存储为矢量以外的其他值?

意识到,这可能太大了,无法可视化,甚至根本不值得这样做。

欢迎任何提示或指导。

我要使用的代码是:

d=dist(MyData, method = "euclidean")

这给了我“错误:无法分配大小为1.4 Mb的向量”消息

当时我打算使用以下代码来拟合和绘制图形:

fit=cmdscale(d,eig=TRUE, k=2)
p = ggplot(data.frame(MyData), aes(fit$points[,1], fit$points[,2], color =  factor(Kmeans$cluster))) 
p <- p + theme(axis.title.y = element_text(size = rel(1.5), angle = 90))
p <- p + theme(axis.title.x = element_text(size = rel(1.5), angle = 00))
p= p + theme(axis.text=element_text(size=16,angle=90),axis.title=element_text(size=20,face="bold")) + geom_point(size=4)
p= p + theme(legend.text = element_text(size = 14, colour = "black"))
p= p + theme(legend.title = element_text(size = 18, colour = "black"))
p= p  + theme(legend.key.size = unit(1.5, "cm"))
p

0 个答案:

没有答案