使用“ rtweet”库的“ search_tweets”功能停止下载

时间:2019-11-03 21:12:51

标签: r twitter rtweet

我正在尝试使用rtweet软件包从某个特定的标签下载一些tweet。我从一个名为OpenCodez的地方使用了一个指南,但是遇到了问题

使用rtweet软件包的“ search_tweets”功能,我无法下载5条以上的tweets,而rtweet的限制应为18.000条。

我没有收到任何错误,但是运行脚本时的“正在下载”图形仅停止在10%(尝试下载n = 2000时)。

我尝试使用“ retryonratelimit = TRUE”,但不走运。我已经重置了脚本,尝试了各种教程来建立连接-一切正常-直到我实际使用search_tweets-function为止。

这是我连接到API的代码:

api_key <- "xxxx"
api_secret_key <- "xxxx"
access_token <- "xxxx"
access_token_secret <- "xxxx"

## authenticate via web browser
token <- create_token(
  app = "xxxx",
  consumer_key = api_key,
  consumer_secret = api_secret_key,
  access_token = access_token,
  access_secret = access_token_secret)

这是我的“刮板”:

my_tweets = search_tweets("#vmd19", n=2000, lang='en')

最终的数据帧仅是5列,这是奇怪的,因为在标签下至少应该有几百条tweet。我尝试了不同的查询(标签等),但是没有运气。下载停止如下:

Downloading [===>-------------------------------------]  10%

我无法弄清楚自己在做什么。希望有人可以帮助我解决这个问题!

1 个答案:

答案 0 :(得分:2)

此问题已在此处解决:https://github.com/ropensci/rtweet/issues/364

这似乎是因为您可以在其中收集推文的窗口(大约在上周)。如果该时间窗口中可用的推文数量小于search_tweets函数中的n,它将在达到100%之前中断。因此,如果您要求使用特定术语发送100条推文,而该术语在上周只发布了7次,则它将以7%的速度停止下载。