在许多情况下,HTML文件如下:
<h1>Topic 1</h1>
<p>...</p>
<h2>Topic 1.1</h2>
<p>...</p>
<p>...</p>
<p>...</p>
<p>...</p>
<h2>Topic 1.2</h2>
<p>...</p>
<p>...</p>
<p>...</p>
<p>...</p>
<h2>Topic 1.3</h2>
<p>...</p>
<p>...</p>
<p>...</p>
<p>...</p>
实际上在语义上是这样的(如果用XML表示):
<topiclevel1>
<p>...</p>
<topiclevel2>
<p>...</p>
<p>...</p>
<p>...</p>
<p>...</p>
</topiclevel2>
<topiclevel2>
<p>...</p>
<p>...</p>
<p>...</p>
<p>...</p>
</topiclevel2>
<topiclevel2>
<p>...</p>
<p>...</p>
<p>...</p>
<p>...</p>
</topiclevel2>
</topiclevel1>
是否有标准化的方式将前者转换为后者。具体来说,有没有这样做的PHP库?