如何筛选出由file_get_contents抓取的内容?

时间:2014-04-06 10:28:51

标签: php html file file-get-contents

我用这一行在变量$ html中获取页面的源代码:

$html = file_get_contents('http://www.google.com');

当我做<textarea><?php echo htmlentities($html); ?></textarea>

它很棒。

现在,假设我想在页面中取出每个<h1>标签,其内容在变量$ h1中,我该如何从$ html变量执行此操作?

1 个答案:

答案 0 :(得分:-1)

您可以使用Simple Html Dom Parser

下载所需文件并尝试以下代码:

<?php

require_once ('simple_html_dom.php');
$html = file_get_contents('http://www.google.com');
$domHtml = str_get_html($html);
foreach ($domHtml->find('h1') as $element) {
    echo '<h1>' . $element->innertext . '</h1>';
}