通过网页抓取从网站获取数据

时间:2017-03-18 11:16:14

标签: php web-scripting

我想从一个内部div中存储数据的网站获取所有图像,如何获取所有图像。我试过但它无法正常工作。这是我的代码

  <?php
$html = file_get_contents('http://en.vonvon.me/'); //get the html returned from the following url

$pokemon_doc = new DOMDocument();

libxml_use_internal_errors(TRUE); //disable libxml errors

if(!empty($html)){ //if any html is actually returned

    $pokemon_doc->loadHTML($html);
    libxml_clear_errors(); //remove errors for yucky html

    $pokemon_xpath = new DOMXPath($pokemon_doc);

    //get all the h2's with an id
    $pokemon_row = $pokemon_xpath->query('div[class=desc ng-binding]');

    if($pokemon_row->length > 0){
        foreach($pokemon_row as $row){
            echo $row->nodeValue . "<br/>";
        }
    }
}
?>

1 个答案:

答案 0 :(得分:0)

你不能废弃使用JavaScript工作的网站[Angular],刮刀在执行JavaScript后没有看到DOM。

但另一方面,如果图像在dom中,则可以使用

最好的事情是Simple HTML DOM Parser

$html = file_get_html('http://vonvon.me/');

// Find all images 
foreach($html->find('img') as $element) 
       echo $element->src . '<br>';