我想使用cURL
解析外部html页面。
这是我的简单代码:
$ch=curl_init($url);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
curl_setopt($ch,CURLOPT_HEADER,0);
$data=curl_exec($ch);
curl_close($ch);
但我不知道如何访问和回显我的愿望标记(例如div
class="news"
)
注意:我不想使用simple_html_dom
。它比cURL慢,导致我出错。
答案 0 :(得分:1)
simple_html_dom
并不慢。你可以像下面那样做你的工作;
<?php
include_once('simple_html_dom.php');
$url =''; // Put your crawl url here
$news = array();
$html = file_get_html($url);
foreach ($html->find('div') as $div){
if ($div->getAttribute('class') == "news")
array_push($news, $div->getAttribute('class'));
}
echo implode("\n ", $news);