从Twitter中提取多页搜索词

时间:2009-05-11 20:26:18

标签: php twitter

我正试图通过PHP和Twitter搜索api找出一种方法来提取特定搜索词的所有推文。

所以功能包括 1.包括搜索词 2.从每页中提取条款。 3.仅从上次搜索中提取新术语 4.导出到数据库或平面文件。

除了遍历多个页面之外,我对所有这些都很清楚

3 个答案:

答案 0 :(得分:5)

twitter API采用页码参数。在atom结果中,有链接元素,具有next和previous的rel属性。这将是您是否应该去寻找第二页等的最佳指标。该标记的href属性甚至会告诉您应该请求的URL。

您创建的查询也会使用since_id参数。您需要存储在响应中看到的最大ID号,并在后续请求中使用它,这样您就不必过滤重复项。

对于数据存储,您的选择可能最好以您计划对结果进行的操作为指导...如果您要进行任何查询,您应该将其存档到数据库中,即MySQL。如果您只是记录,平面文件应该没问题。

答案 1 :(得分:0)

搜索API有一个page参数:

  

页面:可选。要返回的页码(从1开始),最多大约1500个结果(基于rpp *页面。注意:有分页限制。

     

示例:http://search.twitter.com/search.atom?q=devo&rpp=15&page=2

这有帮助吗?

答案 2 :(得分:0)

twitter search api采用页面参数:

  

#page:可选。要返回的页码(从1开始),最多可返回   大约1500个结果(基于rpp   *页面。注意:有分页限制。

* Example: http://search.twitter.com/search.atom?q=devo&rpp=15&page=2