遵循所有Twitter用户的最佳算法

时间:2011-01-03 22:03:19

标签: algorithm twitter

使用twitter API跟踪所有Twitter用户的最佳算法是什么?我一直在思考这个问题,我找不到任何最佳的迭代方法。 提前感谢任何建议。

3 个答案:

答案 0 :(得分:4)

除了“你为什么要做这样的事情?”之外。并且“这将使你的知识产权被禁止”等等。

这与编写网络爬虫不应该完全不同。我首先找到一些根源并将他们的跟随者/追随者投入到按用户拥有的跟随者/追随者数量排序的优先级队列中,忽略您已经访问过的关注者/关注者。然后使用优先级队列访问用户,找到具有最多新关注者/关注者的用户,随着时间的推移保持pq更新。

同样,这听起来像是在实践中实施的一个糟糕的主意。 Twitter在2010年7月有190 million users

答案 1 :(得分:2)

只要您拥有理论机器,因此API调用的时间和数量无关紧要,解决方案很简单。每个用户都有一个唯一的ID。我关注的用户上周创建了他的帐户,其ID为229,863,592,所以让我们使用250,000,000作为理论终点。您可以从ID 1开始,并使用API​​跟踪每个用户1到250000000.任何已删除其帐户或已被暂停的用户在您尝试关注它们时都会返回错误。通过id一次跟踪5,000个用户的Twitter API是:

http://dev.twitter.com/doc/post/friendships/create

答案 2 :(得分:0)

许多用户不会被任何人关注,他们也不会关注任何人。如何使用API​​找到它们而不试图随机猜测它们的用户名?