R中的Mclust:如何输出集群中心

时间:2018-03-06 08:49:11

标签: r text-mining mclust

我目前正在使用RStudio在支持故障单上进行文本挖掘,按照描述(freetext)对它们进行聚类。为此,我将kmeans与EM算法进行比较。我使用tm包准备了数据,现在我尝试将聚类算法应用于数据矩阵。

使用kmeans()函数,我可以使用以下代码片段输出文本集群中最常用的5个术语(kmeans21):

> for (i in 1:num_cluster) {
     cat(paste("cluster ", i, ": ", sep = ""))
     s <- sort(kmeans21$centers[i, ], decreasing = T)
     cat(names(s)[1:5], "\n")
 }

到目前为止,我找不到在mclust包中执行相同操作的功能。我的数据格式如下:

> bic21 <- MclustBIC(m1, G=21)
> emmodel21 <- summary(bic21, data = m1)

使用命令

> emmodel21$classification

我可以看到每个支持小组的群集,但是是否有可能输出最常用的术语,如第一个代码块中的kmeans?

2 个答案:

答案 0 :(得分:0)

我想你可以试试

summary(mod1, parameters = TRUE)

刚试过链接

中的相同示例
library(mclust)
data(diabetes)
X <- diabetes[,-1]
BIC <- mclustBIC(X)
mod1 <- Mclust(X, x = BIC)
summary(mod1, parameters = TRUE)

答案 1 :(得分:0)

略微改变小插图中的第一个例子:

data(diabetes)
X <- diabetes[,-1]
mod <- mclust(X)
means <- mod$parameters$means

均值对象现在是一个包含聚类均值的矩阵。