如何使用Twitter Search API在一小时内聚合给定查询的推文?

时间:2016-05-19 18:26:07

标签: python twitter tweepy

好的,我正在使用Twitter API的Tweepy界面来汇总特定查询词的推文,以便实时对其进行情感分析。我的目标是在给定的查询字词中搜索过去7天内每天每小时的推文,并分析情绪随时间变化的情况。每个搜索请求都会返回100条推文。

据我了解,Twitter API提供sinceuntil属性,以便在搜索查询中指定可以输入两个不同的日期,并在给定日期内提取推文。但是,它似乎不适用于任何其他时间段(如小时或分钟)。有没有办法可以做到后者?

奖金问题:在搜索过程中,75%的推文都是同一条推文的转推。通过检查每条推文的retweeted_status属性,我必须删除所有重复的推文。在获取它们之前,API中是否有任何规定可以删除服务器端的转发,从而获得更多相关数据?

1 个答案:

答案 0 :(得分:0)

对于奖励问题,是的,您可以按照Twitter API文档在API级别过滤转发 https://developer.twitter.com/en/docs/tweets/rules-and-filtering/overview/standard-operators
在传递给游标之前,只需将其添加到查询中即可。

query="search_this -filter:retweets"

相关StackOverflow问题
Tweepy - Exclude Retweets