Question

我使用simpleHTMLDom解析器，它可以很好地使用url，例如：http://someWebSite.com/page/1假设我想从第1页到第20页进行解析（对于包含分页的网站）。

我已经尝试过（天真）这个：

for($page = 1; $page <= 20; $page++){
  $getHTML = file_get_html('http://website.com/page/'.$page);
 }

它不起作用（它获取最后一页并解析它）

请帮忙吗？

Answer 1

for($page = 1; $page <= 20; $page++){
    $getHTML = file_get_html('http://website.com/page/'.$page);

    // <-- Do your stuff here
}

或

$getHTML = array();
for($page = 1; $page <= 20; $page++){
    $getHTML[] = file_get_html('http://website.com/page/'.$page);
}
foreach($getHTML as $html){
    // Do stuff with $html
}

你需要使用HTML来获取下一个或者存储它，然后将它存储到某个地方。

如何使用包含分页的url的simpleHTMLdom解析器？

1 个答案: