按逻辑类别对博客进行聚类和排名

时间:2009-10-06 15:26:24

标签: algorithm machine-learning blogs

什么样的算法可以在逻辑社区(技术,娱乐等等)中对博客进行聚类和排名?

对博客帖子进行聚类和排名的算法会更好。

接受的答案是算法,伪代码,java代码或特定算法解释的链接。

更新 所以,似乎我希望基于Partional Clustering的类别主要基于文本特征。

1 个答案:

答案 0 :(得分:1)

首先,您必须通过定义:

来更好地定义问题
  1. 每个博客的特征向量(描述符)
  2. 评估描述符之间“距离”的指标。
  3. 完成后,您可以选择卡车clustering algorithms,例如kmeans等。