R中的hclust,dist解释了聚类单词的方法

时间:2017-01-18 19:49:25

标签: r nlp tm dendrogram hclust

我正在使用twitter API和OAUTH处理一些推文数据。我正在制作一个聚类树形图来聚类500条推文中使用的单词。我不确定hclust函数是如何聚类的。即通过什么规则我需要一些逻辑解释

这是代码

 tweetTDM.reduced<-removeSparseTerms(tweetTDM, 0.992)

 d <- dist(tweetTDM.reduced, method="euclidian")
 fit <- hclust(d, method="ward.D")
 plot(fit)

RStudio Image

我在R中包含了一张我正在看的图片。

0 个答案:

没有答案