如何根据关键字对类似文档进行聚类?

时间:2015-10-01 11:01:22

标签: r nlp cluster-analysis document k-means

我正在研究R中的文档聚类项目。我有100页,每个页面都提取了关键字。现在,我希望以相同概念的相同页面落入同一群集的方式对页面进行聚类。

我找到了很多文档聚类代码,它们只关注关键字聚类而不是页面聚类。对我的问题有任何建议或想法吗?

非常感谢提前:)

1 个答案:

答案 0 :(得分:0)

Getting Started with Latent Dirichlet Allocation using RTextTools + topicmodels

如果您从网页中提取关键字,则根据关键字对您的网页进行聚类。你对页面聚类有什么期望?