使用PHP删除.html文件的部分

时间:2011-10-10 00:55:41

标签: php html parsing

我有一个我想编辑的HTML页面。我想删除.html文件的某个部分,例如。

<div id="gg">
......
......
</div>

我该怎么做?

3 个答案:

答案 0 :(得分:3)

我建议使用PHP的DOM库:

$dom = new DOMDocument;
$dom->loadHTML('<html string />'); // Or $dom->loadHTMLFile('file_name.html');

$xpath = new DOMXPath($dom);
$nodes = $xpath->query('//div[id="gg"]');
if($nodes->length)
  $nodes[0]->parentNode->removeChild($nodes[0]);

$dom->saveHTML(); // Or $dom->saveHTMLFile('file_name.html');

答案 1 :(得分:1)

$file = file_get_contents("index.html");
$file = preg_replace('/<div id="gg">.*?<\/div>/im', '' $file);
file_put_contents($file);

我没有测试过这段代码。

注意:嵌套的div会破坏html结构。

答案 2 :(得分:1)

使用XML(或HTML)解析器可能会有一些运气。 PHP 5的This one看起来非常容易使用,它提供了一种机制,用于通过ID查找特定元素,然后将其内容设置为空字符串。