我一直在使用Tweepy库(用于python)提取带有关键字的推文。 直到最近,我才注意到我的数据库包含如下这样的推文: tweet example。
我搜索了“臭氧孔”,它返回了一条推文,其文本实际上没有包含“臭氧孔”,但是在新闻标题中可以找到“臭氧孔”,这些推文的作者对此进行了编辑。参考。
有什么方法可以避免这样的推文并搜索在实际推文中包含我的关键字的推文?
我的搜索推文代码的块:
for tweet in tweepy.Cursor(api.search,
q="ozone hole",
lang="en",
#Since="2019-11-27",
#until="2019-11-14",
tweet_mode='extended').items():
答案 0 :(得分:3)
这就是Twitter搜索的工作原理。如果您通过Twitter的网站搜索相同的查询,您会发现它具有相同的结果。
不过请注意,这可能是由于查询显示在URL本身而不是网站标题中。