R,twitteR包:如何从一年中的特定时间获取推特状态?

时间:2014-03-10 17:24:35

标签: r twitter

我对R及其Twitter软件包很新。 作为一名学生,我试图在10月份(2013年,2012年,2011年)获得大约30名特定人员的推特状态。 我已经使用此代码成功获得了其中一个

test.X<- userTimeline("X", n=3200, maxID=twitter-id-of-the-last-tweet-of-the-month, sinceID=twitter-id-of-the-first-tweet-of-the-month, includeRts=FALSE, retryOnRateLimit=1500) Y <- do.call("rbind", lapply(test.X, as.data.frame)) write.table(Y,file="nameoct13.csv",sep=",",row.names=T)

但这需要相当长的时间,如:

  1. 我必须手动向下滚动时间线,以获取当月第一条和最后一条推文的ID。
  2. 我必须为每个人做3次
  3. 我必须为30人重新做这个操作。
  4. 任何人都可以帮助简化任何这些任务吗?

    -

    当我输入这些行时,我认为可能更简单的方法是从用户的第一条推文到2013年10月的最后一条推文获取所有内容,但是:

    1. 可能会有最多的推文到达(不是吗?)。
    2. 这仍然让我们(好吧,我,无论如何)有很长时间滚动时间线的问题......有些用户有大约10K的推文......
    3. 感谢社区提供的帮助。 V.A。

1 个答案:

答案 0 :(得分:1)

不幸的是,你不能用twitteR::做你想做的事情。 twitteR::访问一个Twitter API,它只返回几周之前发布的推文。使用twitteR::无法获取历史推文,因为twitter不允许这样做。

使用rvest进行抓取可能会更好。