这是我的代码:
<?php
include("includes/simple_html_dom.php") ;
$url_to_get = "http://getconfused.net/" ;
$homePage = file_get_html($url_to_get);
$allLinks = $homePage->find('a');
foreach ( $allLinks as $link)
{
$href = $link->innertext ;
echo $href . "</br>" ;
}
?>
简单。只需获取页面,找到任何链接并打印innertext(<a >innertext</a>
)。但由于某种原因,这里简单的html dom正在跳过很多链接。具体而言,它缺少页面第一个div(<div id="getconfused">
)的所有链接。
为什么?可以做些什么来解决这个问题呢?
答案 0 :(得分:0)
身体中有div吗?页面是否有效? 可能html在该部分已损坏,导致div被跳过。