我使用以下代码从指定页面获取完整html :
$url = "http://www.google.com";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$result = curl_exec($ch);
curl_close ($ch);
问题:如何将此代码修改为返回<title>
而不是页面的完整html。 $ result存储结果。
答案 0 :(得分:7)
你可以使用正则表达式获得标题,我发现这个正则表达式非常有用:
function get_html_title($html){
preg_match("/\<title.*\>(.*)\<\/title\>/isU", $html, $matches);
return $matches[1];
}
答案 1 :(得分:4)
你不能真正获得标题,你可以获得整个文档,然后清除你需要的元素:我喜欢使用Simple Html Dom Parser
$html = file_get_html('http://www.google.com/');
$title = $html->find('title');
答案 2 :(得分:-1)
查看解析结果的内容
使用正则表达式
或Dom文档