我正在寻找一个包含地理定位数据的大型推文数据集(来自美国)。 在任何地方都有这样的数据集吗?我看了一下infochimps,但没有看到任何东西。
如果没有,自己生成此数据集的最佳方法是什么?我应该在本地计算机上运行Twitter Streaming API(或者可能在AWS上运行?),然后过滤并保存所有带地理标记的推文?
答案 0 :(得分:2)
Streaming API可能是您最好的选择。只需使用location
过滤器设置您要从中捕获数据的地理区域。
这是一个稍微related question: Requesting just geotagged statuses from the Twitter API