Question

我正在使用R的mclust包来聚类时间过程中的基因表达数据。我成功运行了少于8000行的数据mclust的{{1}}函数。对于每一行，我都可以看到具有mod1<-mclust(data)和mod1$z

的群集的概率

但是我需要确定给定基因表达谱可以说6个时间点（实际上是一行）不在聚类数据中。我如何确定它先前获得的集群是什么？

感谢您的回复......

Answer 1

当您想要根据其他数据建立的模型对新观察结果进行预测时，您首先想到的应该是predict函数。大多数建模软件包都重载了这个函数来做正确的事情。与mclust包相同。以下是使用iris数据

的示例

mod1 <- Mclust(iris[,1:4])
summary(mod1)
plot(iris[,1:4], col=predict(mod1)$classification)
pred<-predict(mod1, newdata=matrix(c(6.75,2.9,6,1.7),nrow=1))
pred$classification  #predicted class

阅读?predict.Mclust帮助页面以获取完整文档

如何在R中使用Mclust软件包对训练数据进行聚类后，确定新数据属于哪个集群

1 个答案: