如何使用包含分页的url的simpleHTMLdom解析器?

时间:2016-03-22 14:52:49

标签: php simple-html-dom

我使用simpleHTMLDom解析器,它可以很好地使用url,例如:http://someWebSite.com/page/1假设我想从第1页到第20页进行解析(对于包含分页的网站)。

我已经尝试过(天真)这个:

for($page = 1; $page <= 20; $page++){
  $getHTML = file_get_html('http://website.com/page/'.$page);
 }

它不起作用(它获取最后一页并解析它)

请帮忙吗?

1 个答案:

答案 0 :(得分:0)

for($page = 1; $page <= 20; $page++){
    $getHTML = file_get_html('http://website.com/page/'.$page);

    // <-- Do your stuff here
}

$getHTML = array();
for($page = 1; $page <= 20; $page++){
    $getHTML[] = file_get_html('http://website.com/page/'.$page);
}
foreach($getHTML as $html){
    // Do stuff with $html
}

你需要使用HTML来获取下一个或者存储它,然后将它存储到某个地方。