如何从多个用户中提取所有推文'使用R的时间表?

时间:2016-04-12 19:07:28

标签: python r twitter twitter-rest-api twitter-r

我正在开展一个项目,我想要提取大约500个不同Twitter用户的时间表(我使用它进行历史分析,所以我只需要一次检索它们 - 无需更新传入的推文)。

虽然我知道Twitter API只允许检索最后3,200条推文,但当我使用R twitteR软件包的基本UserTimeline方法时,我每次尝试时似乎只能获取大约20条(对于明显更多的用户,最近,推文)。这是因为速率限制,还是因为我做错了什么?

有没有人有最有效率的提示?我意识到由于速率限制可能需要花费很多时间,有没有办法在R中自动化/迭代这个过程?

我很困惑,所以非常感谢您提供的任何帮助/提示!

(我有一些使用Twitter API / twitteR软件包在几天内使用某个标签提取推文的经验。我有基本的Python技能,如果事实证明在Python中更容易/更快)。

1 个答案:

答案 0 :(得分:0)

看起来twitteR documentation建议使用maxID参数进行分页。因此,当您获得第一批结果时,您可以使用该组中的最小ID减去一个作为下一个请求的maxID,直到您得不到更多结果(这意味着您已经获得了结果)用户时间线的开头)。