我正在使用python库“ Tweepy”及其函数api.search,可以在其中传递查询字符串。
当前,我正在查询带有参数“ -filter:retweets”的井号标签,即“ #stackoverflow”,效果很好。
我现在的问题是,Tweepy / Twitter响应将包含Tweet对象,其中主题标签不在正文中,而是在用户的个人资料中。这意味着每当该用户发推文时,我还将在响应数据集中找到他无关的推文。
示例:
api.search(q="#innovation -filter:retweets", count=100)
这将提供一个包含100个Tweet对象的数据集,目前,其中50-80个是不相关的,而标签“ #innovation”位于用户个人资料正文中。
我需要什么:
api.search(q="#innovation -filter:retweets -filter:profiles", count=100)
但是,我还没有找到有关过滤器值的任何文档。 目前,我正在检查是否在实际的Tweet中找到了#标签,并丢弃了废话,但这很浪费。
预先感谢