我正在使用此代码。但它返回的是html代码。
$site=file_get_contents("http://www.example.com/".$link);
preg_match_all('/<h1>(.*?)<\/h1>/',$site,$baslik);
它正在返回&lt; H1&GT;导致&LT; / H1取代。但我想看看结果。 感谢。
答案 0 :(得分:1)
使用DOMDocument:
$dom = new DOMDocument();
@$dom->loadHTMLFile('http://www.example.com/' . $link);
$h1Nodes = $dom->getElementsByTagName('h1');
foreach ($h1Nodes as $h1Node) {
echo "\n" . $h1Node->nodeValue;
}