如何在R中使用Mclust软件包对训练数据进行聚类后,确定新数据属于哪个集群

时间:2014-05-08 16:34:22

标签: r

我正在使用R的mclust包来聚类时间过程中的基因表达数据。 我成功运行了少于8000行的数据mclust的{​​{1}}函数。对于每一行,我都可以看到具有mod1<-mclust(data)mod1$z

的群集的概率

但是我需要确定给定基因表达谱可以说6个时间点(实际上是一行)不在聚类数据中。我如何确定它先前获得的集群是什么?

感谢您的回复......

1 个答案:

答案 0 :(得分:0)

当您想要根据其他数据建立的模型对新观察结果进行预测时,您首先想到的应该是predict函数。大多数建模软件包都重载了这个函数来做正确的事情。与mclust包相同。以下是使用iris数据

的示例
mod1 <- Mclust(iris[,1:4])
summary(mod1)
plot(iris[,1:4], col=predict(mod1)$classification)
pred<-predict(mod1, newdata=matrix(c(6.75,2.9,6,1.7),nrow=1))
pred$classification  #predicted class

阅读?predict.Mclust帮助页面以获取完整文档