我想转换html中的列表结构:
<ul>
<li>Section 1</li>
<li>Section 2
<ul>
<li>Section 2.1</li>
<li>Section 2.2</li>
</ul>
</li>
<li>Section 3</li>
</ul>
像这样的XML:
<sections>
<section>
<caption>Section 1</caption>
<level>0</level>
</section>
<section>
<caption>Section 2</caption>
<level>0</level>
</section>
<section>
<caption>Section 2.1</caption>
<level>1</level>
</section>
<section>
<caption>Section 2.2</caption>
<level>1</level>
</section>
<section>
<caption>Section 3</caption>
<level>0</level>
</section>
</sections>
我尝试使用PHP SimpleXML来读取html,但是当它遇到<ul>
标记内的<li>
标记时似乎有问题。
我想知道是否有人可以建议用PHP完成这项工作的最简单方法是什么?
非常感谢大家。
答案 0 :(得分:3)
您总是可以将HTML解析为XML结构。像这样:
我们假设您的HTML位于名为“sections.html”的页面中。这是你可以做你想做的事情的一种方式:
<?php
# Create new DOM object
$domOb = new DOMDocument();
# Grab your HTML file
$html = $domOb->loadHTMLFile(sections.html);
# Remove whitespace
$domOb->preserveWhiteSpace = false;
# Set the container tag
$container = $domOb->getElementsByTagName('ul');
# Loop through UL values
foreach ($container as $row)
{
# Grab all <li>
$items = $row->getElementsByTagName('li');
# echo the values
echo $items->item(0)->nodeValue.'<br />';
echo $items->item(1)->nodeValue.'<br />';
echo $items->item(2)->nodeValue;
# You could write to your XML file, store in a string, anything here
}
?>
我没有测试过这个,但这是一般的想法。
希望这会有所帮助。