我希望将我的数据聚类为5个聚类,然后我们需要从所有数据中选择50个具有最不相似关系的个体。这意味着如果集群一包含100,两个包含200,三个包含400,四个包含200和五个100,我必须从第一个集群中选择5个+从第二个集群中选择10个+从第三个中选择20个+从第四个中选择10个+ 5从第五个。
数据示例:
mydata<-matrix(nrow=100,ncol=10,rnorm(1000, mean = 0, sd = 1))
我到目前为止所做的是对数据进行聚类并对每个群集中的个体进行排名,然后将其导出为excel并从那里开始......由于我的数据变得非常大,这已经成为一个问题。
我将非常感谢有关如何在R中应用之前的任何帮助或建议。