Twitter使用什么算法来确定您在search.twitter.com可以看到的10个主题?我想实现该算法,我还想展示50个最受欢迎的主题(而不是10个)。你能描述最有效的算法吗?
谢谢!
(Twitters API可在 - http://apiwiki.twitter.com/REST%20API%20Documentation)
找到此外,我希望能够通过搜索公共时间轴来实现该算法 - http://twitter.com/statuses/public_timeline.rss
答案 0 :(得分:12)
关于quora的这篇文章支持了这一点。 http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm
衰减通常是通过使用算法中帖子的相对年龄来完成的,从而为更新的主题/帖子等提供更多权重。
答案 1 :(得分:1)
所以Twitter可能做的是它计算一个特定术语的提及次数减去停止词(停止的话,如:做,我,你,我,不,等等) 所以“猫不在包里”和“我的狗吃了我的猫”意味着猫,狗和包将是它提取的术语(其余都是停止的话) 然后它将'cat'计为2个引用,因此在这种情况下'cat'将成为热门话题。