我正在尝试使用twitteR软件包版本twitteR_1.1.8抓取推文,我想通过使用maxID来执行此操作。甚至maxID属性也在twitteR手册中,该手册于11月2日发布;我收到一条警告,即maxID无法识别。让我用一个例子来解释自己:
> t <- searchTwitter('#sample',n=10)
> sapply(t,function(x) x$getId())
[1] "567760958798700545" "567760485538615296" "567760474096168961"
[4] "567759761916325888" "567757164480299009" "567752193219235840"
[7] "567751648655982594" "567750943216001024" "567747456667254784"
[10] "567745734087172096"
> t1 <- searchTwitter('#sample',n=5,maxID='567757164480299009')
Warning messages:
1: In mapCurlOptNames(names(.els), asNames = TRUE) :
Unrecognized CURL options: maxid
2: In mapCurlOptNames(names(.els), asNames = TRUE) :
Unrecognized CURL options: maxid
> sapply(t1,function(x) x$getId())
[1] "567760958798700545" "567760485538615296" "567760474096168961"
[4] "567759761916325888" "567757164480299009"
如您所见,我不能简单地在代码中使用maxID。 R版本3.1.2和twitteR版本twitteR_1.1.8。问题是什么?提前谢谢..
答案 0 :(得分:0)
使用twitteR
1.1.8,您的代码非常适合我。您收到的错误不是来自twitteR
,它来自RCurl
包。该软件包最近经过了一些修改,其中一个在我的系统上导致任何https://
请求失败。所以,我认为这是你的主要嫌疑人。另一个潜在的嫌疑人是httr
包裹。
供参考,我正在使用RCurl_1.95-4.5
和httr_0.6.1
。
答案 1 :(得分:-1)
我有同样的问题 - 尽管有max(id)作为sinceID我正在重复推文!
这是代码:
my_tweets = searchTwitter(as.character(v_search[,i]), lang=NULL, n=10, sinceID = arr_since_id[i])
v_max_id <- max(my_tweets$id)
arr_since_id[i] <- v_max_id
packageVersion(&#34; RCurl&#34) [1]'1.95.4.5'
packageVersion(&#34;微博&#34) [1]'1.1.8'
packageVersion(&#34; HTTR&#34) [1]'0.6.1'