使用简单的HTML dom解析rss feed不适用于任何元素

时间:2015-03-09 12:44:34

标签: javascript php dom rss

我使用简单的HTML DOM来屏蔽废弃rss Feed http://rss.sciencedirect.com/publication/science/09218009,这是我的代码:     require_once DOMAIN_DIR。 'simple_html_dom.php';

$articles = array();
getArticles('http://rss.sciencedirect.com/publication/science/09218009');

function getArticles($page) {
    global $articles;

    $html = new simple_html_dom();
    $html->load_file($page);

    //echo $html;

    $items = $html->find('.entry'); 
    echo sizeof($items);
    /*foreach($items as $post) {
        # remember comments count as nodes
        $articles[] = $post->innertext;
        //echo $html;
    }

    foreach($articles as $item) {
        echo "<div class='item'>";
        echo $item;
        echo "</div>";
    }*/
}

好的部分是load_file($page)有效,当我将其输出到浏览器时,它会显示整个页面。

到目前为止运行良好。

现在的问题是$items等于[],是的nada!

当我分析dom时,我发现有一个javascript初始化函数,我怀疑它是罪魁祸首。

我需要知道如何:

  1. 这个php库可以做某种js initilization
  2. 如果不是,我可以使用其他替代方案
  3. 由于

0 个答案:

没有答案