我使用simpleHTMLDom解析器,它可以很好地使用url,例如:http://someWebSite.com/page/1
假设我想从第1页到第20页进行解析(对于包含分页的网站)。
我已经尝试过(天真)这个:
for($page = 1; $page <= 20; $page++){
$getHTML = file_get_html('http://website.com/page/'.$page);
}
它不起作用(它获取最后一页并解析它)
请帮忙吗?
答案 0 :(得分:0)
for($page = 1; $page <= 20; $page++){
$getHTML = file_get_html('http://website.com/page/'.$page);
// <-- Do your stuff here
}
或
$getHTML = array();
for($page = 1; $page <= 20; $page++){
$getHTML[] = file_get_html('http://website.com/page/'.$page);
}
foreach($getHTML as $html){
// Do stuff with $html
}
你需要使用HTML来获取下一个或者存储它,然后将它存储到某个地方。