Twitter高级搜索结果按年度分布不均

时间:2017-07-06 02:29:04

标签: python twitter

我正在使用Twitter浏览器搜索功能超过api的一周限制并收集历史推文用于研究目的。我正在使用这里找到的github存储库:https://github.com/Jefferson-Henrique/GetOldTweets-python
这一切都很好,但有一个相当奇怪的故障。我在2013年1月1日至2017年6月15日期间在德里方圆300英里范围内收集了一些推文,虽然我收到了所有4。5年的推文,但从2013年12月到2015年4月,总会有更多的推文,无论关键字或位置是什么。我在网上搜索推特是否对如何存储推文进行了某种改变,但没有找到合理的解释,这使我在这里。 这是一个代码片段(如果需要,我可以提供更多或输出文件):

wordsearch("headache", 0, "en", "40.7128,-74.0059", "2015-01-01", "headacheNYC2015", "300mi")

此外,它不是由于第三方来源,因为它们包括在内。还有一个显着的转发缺乏。我知道搜索功能只提供1%的随机样本,但这是一个单独的问题,因为2015年4月之后从未有过多的推文。 如果有人知道任何可能的原因,请分享!

1 个答案:

答案 0 :(得分:0)

找出答案。在2015年,Twitter改变了地理标记的工作方式,他们添加了关闭地理标记推文的首选项/设置默认首选项。因此,在搜索地理标记的推文时,在此之后会有更少的推文。可以找到更多详细信息here