Question

我目前正在使用RStudio在支持故障单上进行文本挖掘，按照描述（freetext）对它们进行聚类。为此，我将kmeans与EM算法进行比较。我使用tm包准备了数据，现在我尝试将聚类算法应用于数据矩阵。

使用kmeans（）函数，我可以使用以下代码片段输出文本集群中最常用的5个术语（kmeans21）：

> for (i in 1:num_cluster) {
     cat(paste("cluster ", i, ": ", sep = ""))
     s <- sort(kmeans21$centers[i, ], decreasing = T)
     cat(names(s)[1:5], "\n")
 }

到目前为止，我找不到在mclust包中执行相同操作的功能。我的数据格式如下：

> bic21 <- MclustBIC(m1, G=21)
> emmodel21 <- summary(bic21, data = m1)

使用命令

> emmodel21$classification

我可以看到每个支持小组的群集，但是是否有可能输出最常用的术语，如第一个代码块中的kmeans？

Answer 1

我想你可以试试

summary(mod1, parameters = TRUE)

刚试过链接

中的相同示例

library(mclust)
data(diabetes)
X <- diabetes[,-1]
BIC <- mclustBIC(X)
mod1 <- Mclust(X, x = BIC)
summary(mod1, parameters = TRUE)

Answer 2

略微改变小插图中的第一个例子：

data(diabetes)
X <- diabetes[,-1]
mod <- mclust(X)
means <- mod$parameters$means

均值对象现在是一个包含聚类均值的矩阵。

R中的Mclust：如何输出集群中心

2 个答案: