从twitter python中检索数据

时间:2013-07-09 11:42:21

标签: python twitter

我正在尝试构建一个应用程序,用户可以在其中连接到我的应用程序,输入关键字以便在Twitter上搜索,然后结果将存储在数据库中。从用户输入关键字的那一刻起,我想跟踪Twitter上的内容。将进一步分析这些结果,并向用户呈现一些统计数据。 到目前为止,我已经使用tweppy和twitter流API来获取推文。但我意识到我不能有多个开放的流媒体连接(用于并行搜索多个关键字) 我搜索了stackoverflow并找到了解决方案,比如断开连接,连接然后使用新关键字进行搜索,但在这种情况下,我将丢失数据。

我还检查了Twitter API,它给你450个结果最多/ 15分钟:
https://dev.twitter.com/docs/rate-limiting/1.1/limits

Stream API:
- 公共流不会让机会拥有更多的联系 - 网站流不会给你搜索的机会

Firehose API不是选项,因为太贵了。

我该如何解决这个问题?我看到许多应用程序实时搜索更多实例而不是一个。有没有人见过这个?

1 个答案:

答案 0 :(得分:0)

您可以使用tweepy从示例中收集所有推文或过滤流端点并将其保存到数据库中。然后使用数据库仅返回搜索词的推文。

如果您不希望推文持续时间过长,那么使用nois数据库(如redis)和使用到期时间戳可能会有更好的结果,因此它无法无限填充。