如何使用PHP从某个DIV中删除文本并排除DIV中的html标记

时间:2011-09-26 05:40:20

标签: php screen-scraping scrape

我正在开发一个项目,我需要从特定的div标签中删除文本,但只有文本没有html标签。

这是html的例子:

<div id="divid1" class="divclass1">
<h1>
TEXT INSIDE DIV
</h1>
</div>

我需要在H1标签内刮掉DIV内的文本。我已经尝试了很多方法,但是无法做到这一点。

有什么建议吗?谢谢!

2 个答案:

答案 0 :(得分:0)

使用PHP domparser,这对此有用。

http://www.php.net/manual/en/domdocument.loadhtml.php

答案 1 :(得分:0)

我会使用PHP Simple HTML DOM Parser。

http://simplehtmldom.sourceforge.net/

你可以说:

foreach ($html->find('div[divid1] h1') as $e) 
 echo $e->innertext;

这将回显#divid1里面的h1标签内的文字(但不是标签本身)。

文档很简单,但帮助很多:http://simplehtmldom.sourceforge.net/manual.htm