我目前正在根据某些关键字使用r v.1.0.44和twitteR(最新版本)来搜索推文。具体来说,我使用以下命令:
my_twitter_data <- searchTwitter("#aleppo", n = 40000, lang = "en", since = '2016-12-12', until = "2016-12-13", retryOnRateLimit = 120)
在请求关于#aleppo的40k推文(由于速率限制需要相当长的时间)时,只有5k的结果将是原始推文,即strip_retweets(my_twitter_data, strip_manual=TRUE, strip_mt=TRUE)
将返回长度为5k的列表。
我的问题是我花了很多时间限制因此转发的时间与我的进一步分析无关。我的问题是,如果R中有这种方法解决这个问题,那么我只对原始推文花费我的速率限制吗?
答案 0 :(得分:6)
您可以在查询中添加-filter:retweets
:
my_twitter_data <- searchTwitter("#aleppo -filter:retweets", n = 40000,
lang = "en", since = '2016-12-12',
until = "2016-12-13", retryOnRateLimit = 120)
答案 1 :(得分:1)
my_twitter_data&lt; - searchTwitter(&#34; #aleppo exclude:转推&#34;,n = 40000,lang =&#34; zh&#34;,自= =&#39; 2016-12-12&#39 ;,直到=&#34; 2016-12-13&#34;,retryOnRateLimit = 120)