一些一般的Twitter4J问题

时间:2013-08-26 22:22:59

标签: twitter twitter4j

我正在尝试为一个uni项目的一部分写一篇Twitter4J,但我已经挂了几件事。来自Twitter4J api:

  

void sample()
  开始收听所有公众的随机样本   状态。默认访问级别提供了一小部分   消防水带。 “Gardenhose”访问级别提供了更多的比例   适用于需要a的数据挖掘和研究应用   较大比例为具有统计学意义的样本。

这意味着默认情况下,会向流提供“默认访问权限”,但可以使用其他类型的访问“Gardenhose访问”。它是否正确?如果是这样,您如何访问更高的Gardenhose访问权限?

我问我已经看到一些关于SO的答案表明只有一个级别的访问 - Gardenhose,我试图一劳永逸地解决这个问题。

除此之外,我想要参考(如果可能的话)示例流允许访问的推文数量。我看过很多人引用1%的“默认访问权限”和10%的“gardenhose访问权限” - 但我无法在API中找到它。

总而言之,有两个问题:

  1. 示例流是否具有“默认访问权限”和“gardenhose访问权限”,或只是其中之一?
  2. 这些访问级别可以获得多少Twitter firehose流?
  3. 如果回复,请尽可能链接到可引用的API。

1 个答案:

答案 0 :(得分:1)

gardenhose与默认样本流不同,您必须从Twitter请求访问才能使用它。

但是,我不确定Twitter是否仍允许访问gardenhose,或者即使它仍然存在。目前的机制似乎是使用Twitter的preferred data partners之一:

  

使用Streaming API?

     

每个Twitter帐户都可以连接到一小部分Streaming API。需要增加数据收集或分析原因访问权限的帐户应查看我们的首选合作伙伴页面。

     

source

students or educational instutions可能会有所不同,而且仍然可以使用花园软管。以前您必须通过电子邮件api-research@twitter.com或者您可以使用以下form,但我不知道这些方法是否仍然有用 - 帖子 已经很久了。

至于默认样本流允许访问的推文的百分比,我能找到的最佳参考是Twitter员工在开发者论坛上发表的评论 - 强调我的:

  

我建议您使用https://stream.twitter.com/1/statuses/sample.json中可以连接到您的Twitter帐户的 1%示例流。您不太可能处于可以访问所有数据并且必须处理样本的情况。每天大约有2.3亿条推文,理论上你每天仍然会收到230万条推文。

     

source

虽然这又是一个老帖子。

关于firehose流,正如文档中指定的那样,您需要被授予访问它的权限,我相信很少有人可以完全访问此流:

  

GET statuses/firehose

     

此端点需要特殊权限才能访问。

     

返回所有公共状态。很少有应用程序需要此级别的访问权限。创造性地使用其他资源和各种访问级别的组合几乎可以满足每个应用程序用例。

总体文档在不同的访问级别及其提供的内容上很少,我建议直接与Twitter联系以讨论您的要求或联系其中一个数据合作伙伴。

道歉,如果这不像你想的那样具体,祝你的研究好运。