我使用简单的HTML DOM来屏蔽废弃rss Feed http://rss.sciencedirect.com/publication/science/09218009,这是我的代码: require_once DOMAIN_DIR。 'simple_html_dom.php';
$articles = array();
getArticles('http://rss.sciencedirect.com/publication/science/09218009');
function getArticles($page) {
global $articles;
$html = new simple_html_dom();
$html->load_file($page);
//echo $html;
$items = $html->find('.entry');
echo sizeof($items);
/*foreach($items as $post) {
# remember comments count as nodes
$articles[] = $post->innertext;
//echo $html;
}
foreach($articles as $item) {
echo "<div class='item'>";
echo $item;
echo "</div>";
}*/
}
好的部分是load_file($page)
有效,当我将其输出到浏览器时,它会显示整个页面。
到目前为止运行良好。
现在的问题是$items
等于[],是的nada!
当我分析dom时,我发现有一个javascript初始化函数,我怀疑它是罪魁祸首。
我需要知道如何:
由于