使用cURL解析HTML页面

时间:2014-01-21 13:56:54

标签: php curl

我想使用cURL解析外部html页面。 这是我的简单代码:

$ch=curl_init($url);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
curl_setopt($ch,CURLOPT_HEADER,0);
$data=curl_exec($ch);
curl_close($ch);

但我不知道如何访问和回显我的愿望标记(例如div class="news"注意:我不想使用simple_html_dom。它比cURL慢,导致我出错。

1 个答案:

答案 0 :(得分:1)

simple_html_dom并不慢。你可以像下面那样做你的工作;

<?php
include_once('simple_html_dom.php');
$url =''; // Put your crawl url here
$news = array();
$html = file_get_html($url);
foreach ($html->find('div') as $div){
    if ($div->getAttribute('class') == "news")
    array_push($news, $div->getAttribute('class'));
}

echo implode("\n ", $news);