我正在研究R中的文档聚类项目。我有100页,每个页面都提取了关键字。现在,我希望以相同概念的相同页面落入同一群集的方式对页面进行聚类。
我找到了很多文档聚类代码,它们只关注关键字聚类而不是页面聚类。对我的问题有任何建议或想法吗?
非常感谢提前:)
答案 0 :(得分:0)
Getting Started with Latent Dirichlet Allocation using RTextTools + topicmodels
如果您从网页中提取关键字,则根据关键字对您的网页进行聚类。你对页面聚类有什么期望?