R Twitter API - twitteR - 更大的半径导致更少的推文

时间:2015-05-22 17:23:03

标签: r api twitter

我正在尝试使用twitteR软件包从Twitter API收集推文。但是,似乎地理编码设置的radius参数表现得很奇怪。

我想最终收集来自美国各地的推文,所以我试图选择该国中部的纬度/经度,其半径足以覆盖美国。然而,似乎我首先获得的推文数量会增加,但随后我会增加半径。我原以为推文的数量会增加,最终会随着我增加半径而收敛到最大值。

以下是我用来测试此代码的代码:

iter <- seq(from=500, to=3000, by=500)
num.tweets <- numeric()
count <- 1
for (i in iter) {
  my.geo <- paste('37.7,-122,', i, 'mi', sep="")
  my.tweets.geo <- searchTwitter("coke", n=1000, lang="en", geocode = my.geo)
  num.tweets <- c(num.tweets, length(my.tweets.geo))
  print("NEW RADIUS")
  print(paste("radius:",i))
  print(paste("number of tweets:", num.tweets[count]))
  count <- count + 1
}

这是相应的输出:

[1] "NEW RADIUS"
[1] "radius: 500"
[1] "number of tweets: 153"
[1] "NEW RADIUS"
[1] "radius: 1000"
[1] "number of tweets: 161"
[1] "NEW RADIUS"
[1] "radius: 1500"
[1] "number of tweets: 139"
[1] "NEW RADIUS"
[1] "radius: 2000"
[1] "number of tweets: 471"
[1] "NEW RADIUS"
[1] "radius: 2500"
[1] "number of tweets: 674"
[1] "NEW RADIUS"
[1] "radius: 3000"
[1] "number of tweets: 139"

正如您所看到的,在这种特殊情况下,随着半径从2500增加到3000,推文数量会减少。推文数量减少的阈值会随着不同纬度/经度设置和不同搜索的变化而变化查询。

1 个答案:

答案 0 :(得分:1)

就地理编码推文而言,twitter API搞砸了。这是一个众所周知的问题。

这是我的项目的写作,它对它有影响:Xamarin

这是一个与Twitter工程师讨论它的线程...... http://www.smartchicagocollaborative.org/foodborne-chicago-affected-by-twitter-geocoding-issue/

我认为您的问题不是由R或twitteR包引起的