如何在从页面抓取时按顺序获取数据

时间:2014-04-05 06:21:28

标签: php dom web-scraping web-crawler simple-html-dom

我正在尝试抓取其中一个网址(http://sportzcosmos.com/2014/03/29/european-football-leagues-weekend-predictions/)。因为我能够将数据单独地分成像段落一样的数组。

但我希望他们按顺序排列在网站上,我使用的是simple_php_dom。

我的代码如下:

foreach($article->find('article.post div.entry-content p') as $p){
        $articlecontent[] = $article->plaintext;        
    }

同样我也可以获得标题:

 foreach($article->find('article.post div.entry-content h2') as $h){
        $articlecontent[] = $article->plaintext;        
    }

但我想让他们按照网站上的顺序排列;有没有办法按顺序获取这些数据?

1 个答案:

答案 0 :(得分:1)

这样做的方法是在同一循环中同时找到两个...

这是一个有效的代码:

$url = "http://sportzcosmos.com/2014/03/29/european-football-leagues-weekend-predictions/";

//Create a DOM object
$html = new simple_html_dom();
// Load HTML from a url
$html->load_file($url);

$articlecontent = array();

foreach( $html->find('article.post div.entry-content p, article.post div.entry-content h2') as $article ){
    $articlecontent[] = $article->plaintext;
}

print_r($articlecontent);

<强>输出

enter image description here