PHP简单的HTML DOM解析器长载网站

时间:2014-07-14 12:35:34

标签: php html parsing dom simple-html-dom

我正在研究一个项目,我有一件事有问题。 由于数据量很大,我要进行屏幕刮擦的网页有大约5-10秒的加载时间。

当我尝试用PHP简单的HTML DOM解析器进行屏幕刮擦时,我没有得到任何结果。 屏幕空白。我使用的所有元素都可以,因为当我从同一个网站输入另一个页面时,在几个起始行中具有完全相同的代码,一切正常。

是否有机会等待网站完成加载然后屏幕刮擦。

由于

我的代码是:

<!DOCTYPE html>
<html>
<head>
<title>Test</title>
</head>
<body>
<?php
error_reporting(0);

include_once('../../simple_html_dom.php');

function scraping_slashdot() {
    // create HTML DOM
    $html = file_get_html('http://www.examplepage.com/');

    // get article block
    foreach($html->find('div[id="rightBlock"]') as $article) {
        // get title1
        $item['title1'] = $article->find('div.[class="inputHead"]', 0)->plaintext;

        $ret[] = $item;
    }


    // clean up memory
    $html->clear();
    unset($html);

    return $ret;
}

// -----------------------------------------------------------------------------
//output
$ret = scraping_slashdot();

foreach($ret as $v) {

    echo $v['title1'];

}
?>
</body>
</html>

1 个答案:

答案 0 :(得分:0)

你尝试过使用jquery吗?您可以通过添加以下内容完成页面加载后的功能:

$(document).ready()