在历史上搜索推特的相关推文

时间:2015-06-18 05:09:29

标签: python twitter twitter-oauth

我希望所有与特定事件相关的推文如何才能完成?粗略搜索表明这是不可能的。虽然有一些付费的解决方案。 https://gnip.com/sources/twitter/historical/ http://keyhole.co/ 有没有解决方法?

意图: 我正在做一个项目,它可以获取与特定事件相关的所有推文。因此,我使用一些关键字进行搜索。虽然这不准确但我以后可以使用一些分类器来过滤噪音。

2 个答案:

答案 0 :(得分:2)

通过公共API,这是不可能的。但是,在Twitter本身,您可以搜索旧的推文,因此可能有使用点击/搜索机器人或网络抓取的解决方法。

我会在这里推荐这篇文章(和评论): https://stackoverflow.com/a/24246840/4131059

他们的API限制(就像我自己一样)是2年。对于他们在网页上的搜索,它是无限的。

编辑:它不是代码:您可以通过其网站使用搜索查询自动收集数据,但您无法使用其API来执行此操作。我将为您提供如何使用搜索查询来获得您想要的内容:

它不是代码:您需要在其网站上使用搜索服务手动收集数据。

这是你如何使用它: 关键字:from,since,until

实施例: 代码自:tenderlove自:2010-01-01至2012-12-31

抓住用户@tenderlove(一位着名的编码员)发来的所有推文,其中包含" code"在2010年1月1日至2012年12月31日的推文中。

现在,如果您尝试使用任何API查询,它将不会给您任何推文,因为它超出了他们的日期范围。

答案 1 :(得分:2)

您可以使用bs4解析推文并将关键字存储在某个文件或数据库中

我正在做一个类似的项目,我所做的就是创建一个匹配关键字的正则表达式。