twitteR r package:如何在API限制内为每个帐户获取尽可能多的推文

时间:2015-07-07 10:51:28

标签: r twitter

我是新手R和twitteR软件包用户,但我无法找到有关如何完成以下操作的强烈建议。

我想挖掘少量的Twitter帐户,以确定其关键字使用的输出。 (即我不知道关键词是什么)

假设

  1. 如果您汇总各种帐户状态,我有一小部分高级帐号(< 6)我想用最多7000条推文进行搜索
  2. 这些帐户没有快速生成新推文(少数几个 天)
  3. 根据lookupUsers()
  4. 返回的个人资料数据,这些帐户的推文少于3200条

    当我使用twitteR函数userTimeline("accountname", n=3200)时,我得到40到600个观察结果返回,即3200附近没有。我知道有API限制但是如果它是一个限制问题我会期望得到相同的观察次数或得到我需要等待15分钟的通知

    如何在仍然玩得很好的同时获得我需要的所有文字?

2 个答案:

答案 0 :(得分:4)

通过使用cran和github包的组合,可以为用户获取所有推文

使用的软件包是在cran和https://github.com/SMAPPNYU/smappR/中提供的streamR,以帮助分析和获取推文。

基本步骤是

  1. 使用oauth和您的Twitter密钥,令牌和秘密对Twitter进行身份验证
  2. 使用smappR函数getTimeline()将推文保存到您指定的json文件
  3. 使用parseTweets(jsonfile)将json内容读入数据框

答案 1 :(得分:0)

这可以通过仍受支持的rtweet软件包来完成。首先,您需要被批准为开发人员并创建应用。 (请注意,twitter现在已经更改了其政策,批准可能需要一段时间。我花了将近一个星期的时间。)

此后,只需使用get_timeline()即可从时间轴获取所有tweet,最多3200。

djt <- get_timeline("adamgreatkind", n = 3200)