我想抓一个博客的标题帖,我写下面的代码。我一直想着如何遍历每一页。
$dom = file_get_html('http://demos.appthemes.com/clipper/');
scrape('http://demos.appthemes.com/clipper/');
function scrape($URL)
{
$dom = file_get_html($URL);
foreach ($dom->find('.item-frame h1 a') as $items) {
$item = array('courseTitle' => $items->text());
var_dump($item);
}
}
for($pages = 0; $pages < 3;$pages++) {
if($next = $dom->find('a[class=page]', $pages)) {
$URL = $next->href;
$dom->clear();
unset($dom);
scrape($URL);
}
}
部分结果确实出现,但卡在错误Undefined variable: dom in on line 23
答案 0 :(得分:0)
unset($dom);
导致$dom
变量未设置,并且在第二次循环迭代($pages == 1
)调用$dom->find
失败。
我没有得到逻辑,但尝试删除$dom->clear(); unset($dom);
行。
希望它有所帮助。