如何获得旧的时间表或推文?

时间:2016-10-05 15:32:27

标签: twitter twitter4j twitter-streaming-api twitter-search

我是韩国的大学生 我和我的顾问教授一起使用twitter的bigdata开发分析应用程序。因此,我在收集推文时会包含特定的关键词(犯罪相关词)。我使用'流媒体api'和'搜索api'现在。我已经看到使用搜索API和流式api结果只返回一周的推文。

我应该获取具有犯罪关键字的旧数据以及自2006年至2016年

你知道吗?

1 个答案:

答案 0 :(得分:1)

可悲的是,你无法从该时间范围内获得推文。 来自documentation

  

搜索API不是所有推文的完整索引,而是最近推文的索引。目前索引包含6-9天的推文。

因此,您只能从搜索API获取最近的推文。在相同的文档中,请注意数据的相关性而不是完整性:

  

在介入之前,重要的是要知道Search API专注于相关性而非完整性。这意味着搜索结果中可能缺少某些推文和用户。如果要匹配完整性,则应考虑使用Streaming API。

如果您真的需要较旧的推文,则必须从Gnip等其他来源获取。否则你将不得不采取不同的方式解决你的问题

如果您拥有要获取信息的所有用户的姓名(或ID),您可以从每个用户获得最多3200条推文的timelines