Question

我使用以下代码从指定页面获取完整html ：

$url = "http://www.google.com";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$result = curl_exec($ch);
curl_close ($ch);

问题：如何将此代码修改为返回<title> 而不是页面的完整html。 $ result存储结果。

Answer 1

你可以使用正则表达式获得标题，我发现这个正则表达式非常有用：

function get_html_title($html){
    preg_match("/\<title.*\>(.*)\<\/title\>/isU", $html, $matches);
    return $matches[1];
}

Answer 2

你不能真正获得标题，你可以获得整个文档，然后清除你需要的元素：我喜欢使用Simple Html Dom Parser

$html = file_get_html('http://www.google.com/');
$title = $html->find('title');

Answer 3

查看解析结果的内容

使用正则表达式

或Dom文档

卷曲页面标题

3 个答案: