查找相关帖子的最佳算法是什么?

时间:2010-02-10 18:11:39

标签: database-design

基本上这是一个数据库和查询问题。如何在您的网站中实现相关帖子,假设您有此表:

+------+        +------+
+ Post +        + Tags  +
-------- N : M  --------

其中post有正文,链接m:n到tag。这是实现标记和帖子的一种非常常见的场景。

那么,您如何在您的网站中实施相关帖子?

1 个答案:

答案 0 :(得分:8)

查找至少在一个标记上重叠的所有帖子,并使用term frequency - inverse document frequency按重要性对标记进行加权,并对权重求和。按总重量的降序返回相关帖子。