twitter4j - 控制采样率

时间:2016-05-27 19:45:31

标签: twitter twitter4j

我需要使用twitter4j库抓取与特定查询相关的推文,持续过去1周。我已经编写了一个批量收集 - 批量重启程序,我在一夜之间运行以收集大约5 GB的推文。我相信这些是通过Twitter API以1%取样的。 我需要跨越一周的推文,但这对我来说是大量的数据。我只需要上周代表的推文。我想知道是否有任何方法可以通过twitter4j配置控制采样率。

1 个答案:

答案 0 :(得分:0)

你不能降低采样率,你应该采取一种让你满意的方法,比如在一小时内收集10%的随机推文,或者使用一些filters ......无论你喜欢什么!