什么是search.twitter.com的“热门话题”算法?

时间:2008-09-27 15:11:42

标签: algorithm search twitter trending

Twitter使用什么算法来确定您在search.twitter.com可以看到的10个主题?我想实现该算法,我还想展示50个最受欢迎的主题(而不是10个)。你能描述最有效的算法吗?

谢谢!

(Twitters API可在 - http://apiwiki.twitter.com/REST%20API%20Documentation

找到

此外,我希望能够通过搜索公共时间轴来实现该算法 - http://twitter.com/statuses/public_timeline.rss

2 个答案:

答案 0 :(得分:12)

Twitter的趋势算法不仅仅是关键词的数量。这是它的一部分,但也有一个衰减因素,所以“justin beiber”不是永远的顶级趋势。

关于quora的这篇文章支持了这一点。 http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm

衰减通常是通过使用算法中帖子的相对年龄来完成的,从而为更新的主题/帖子等提供更多权重。

另见http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-stream?q=trending+algorithm

答案 1 :(得分:1)

所以Twitter可能做的是它计算一个特定术语的提及次数减去停止词(停止的话,如:做,我,你,我,不,等等) 所以“猫不在包里”和“我的狗吃了我的猫”意味着猫,狗和包将是它提取的术语(其余都是停止的话) 然后它将'cat'计为2个引用,因此在这种情况下'cat'将成为热门话题。