我试图通过我指向的标签将html文件分隔为2。
实施例
<html> <head> <title>html title</title> </head> <body> <h1>hello title</h1> <p class="p2"> <span>here is some txt</span> </p> <p class="p2"> hello test, <a id="chp"></a>here is some txt </p> </body> </html>
如果我定义了分隔符&lt; a id =“chp”&gt;&lt; / a&gt; 。这两个文件应如下所示
文件1:
<html> <head> <title>html title</title> </head> <body> <h1>hello title</h1> <p class="p2"> <span>here is some txt</span> </p> <p class="p2"> hello test, </p> </body> </html>
文件2:
<html> <head> <title>html title</title> </head> <body> <h1>hello title</h1> <p class="p2"> <span>here is some txt</span> </p> <p class="p2"> <a id="chp"></a>here is some txt </p> </body> </html>
有人可以告诉我如何实现这个吗?
由于
答案 0 :(得分:0)
如果使用SimpleXML
库加载html,则可以遍历HTML对象以检查每个元素。如果检查每个元素的子节点,在移动到下一个元素之前,对于标记为a
且属性为id
='chp'的元素,可以中断复制并删除内容在该元素之后(直到父元素结束),克隆SimpleXML对象,然后用前一个SimpleXML对象中复制的内容替换整个元素。