我目前正在使用RStudio在支持故障单上进行文本挖掘,按照描述(freetext)对它们进行聚类。为此,我将kmeans与EM算法进行比较。我使用tm包准备了数据,现在我尝试将聚类算法应用于数据矩阵。
使用kmeans()函数,我可以使用以下代码片段输出文本集群中最常用的5个术语(kmeans21):
> for (i in 1:num_cluster) {
cat(paste("cluster ", i, ": ", sep = ""))
s <- sort(kmeans21$centers[i, ], decreasing = T)
cat(names(s)[1:5], "\n")
}
到目前为止,我找不到在mclust包中执行相同操作的功能。我的数据格式如下:
> bic21 <- MclustBIC(m1, G=21)
> emmodel21 <- summary(bic21, data = m1)
使用命令
> emmodel21$classification
我可以看到每个支持小组的群集,但是是否有可能输出最常用的术语,如第一个代码块中的kmeans?
答案 0 :(得分:0)
我想你可以试试
summary(mod1, parameters = TRUE)
刚试过链接
中的相同示例library(mclust)
data(diabetes)
X <- diabetes[,-1]
BIC <- mclustBIC(X)
mod1 <- Mclust(X, x = BIC)
summary(mod1, parameters = TRUE)
答案 1 :(得分:0)
略微改变小插图中的第一个例子:
data(diabetes)
X <- diabetes[,-1]
mod <- mclust(X)
means <- mod$parameters$means
均值对象现在是一个包含聚类均值的矩阵。