在这个用例中,我需要监视Twitters流以获取具有某些哈希标记的推文,然后将这些推文拉出来并存储它们。我正在使用Twitter4J和Twitters Streaming API。要监视的哈希标记经常变化,所以我想每10分钟左右刷新一次过滤器。当我刷新时,我只是从数据层中提取所有新的哈希标记并将它们传递给过滤查询。我的两个问题:
每隔10分钟停止连接并刷新(根据Twitters速率限制等)是否有任何问题
有什么可以阻止我丢失在短暂刷新暂停期间发出的推文吗?
提前致谢。
答案 0 :(得分:0)
您不应该每十分钟重新连接一次,或者您可能会受到速率限制。在删除旧连接之前,您可以形成新连接,这有助于避免数据丢失。请注意,您一次只能有一个未完成的连接。