如何抓取特定的div标签以获取其中的所有数据?

时间:2013-11-15 05:22:02

标签: php xpath web-crawler

实际上我是PHP的新手,我想抓取this链接以获取有关在我们国家/地区提供服务的所有快递公司的信息。我需要的所有信息都是div标签,即。我需要此标签内的所有信息,包括图像,段落和链接。我已经做了一些研究并且能够抓取页面。

     <?php
        function crawl_page($url, $depth = 1)
        {
            static $seen = array();
            if (isset($seen[$url]) || $depth === 0) {
                return;
            }

            $seen[$url] = true;

            $dom = new DOMDocument('1.0');
            @$dom->loadHTMLFile($url);

            $xpath = new DomXpath($dom);
            $divTag = $xpath->query('//div[@class="rescont"]');

foreach ($divTag as $val) {
            echo $dom->saveXML($val).'<br />\n';// or 
          }
  }
    crawl_page("http://www.phonebook.com.pk/Dynamic/Search.aspx?k=courier&l=pakistan&SearchType=kl", 1);

  ?>


修改 现在我可以在我的网页上显示所有内容,但图像和其他一些信息不可用,因为它是相对于该服务器链接的。我也可以提取这些信息吗?

0 个答案:

没有答案