实际上我是PHP的新手,我想抓取this链接以获取有关在我们国家/地区提供服务的所有快递公司的信息。我需要的所有信息都是div标签,即。我需要此标签内的所有信息,包括图像,段落和链接。我已经做了一些研究并且能够抓取页面。
<?php
function crawl_page($url, $depth = 1)
{
static $seen = array();
if (isset($seen[$url]) || $depth === 0) {
return;
}
$seen[$url] = true;
$dom = new DOMDocument('1.0');
@$dom->loadHTMLFile($url);
$xpath = new DomXpath($dom);
$divTag = $xpath->query('//div[@class="rescont"]');
foreach ($divTag as $val) {
echo $dom->saveXML($val).'<br />\n';// or
}
}
crawl_page("http://www.phonebook.com.pk/Dynamic/Search.aspx?k=courier&l=pakistan&SearchType=kl", 1);
?>
修改
现在我可以在我的网页上显示所有内容,但图像和其他一些信息不可用,因为它是相对于该服务器链接的。我也可以提取这些信息吗?