使用PHP从HTML列表生成XML

时间:2011-02-02 23:41:46

标签: php html xml simplexml

我想转换html中的列表结构:

<ul>
    <li>Section 1</li>
    <li>Section 2
        <ul>
            <li>Section 2.1</li>
            <li>Section 2.2</li>
        </ul>
    </li>
    <li>Section 3</li>
</ul>

像这样的XML:

<sections>
    <section>
        <caption>Section 1</caption>
        <level>0</level>
    </section>
    <section>
        <caption>Section 2</caption>
        <level>0</level>
    </section>
    <section>
        <caption>Section 2.1</caption>
        <level>1</level>
    </section>
    <section>
        <caption>Section 2.2</caption>
        <level>1</level>
    </section>
    <section>
        <caption>Section 3</caption>
        <level>0</level>
    </section>
</sections>

我尝试使用PHP SimpleXML来读取html,但是当它遇到<ul>标记内的<li>标记时似乎有问题。

我想知道是否有人可以建议用PHP完成这项工作的最简单方法是什么?

非常感谢大家。

1 个答案:

答案 0 :(得分:3)

您总是可以将HTML解析为XML结构。像这样:

我们假设您的HTML位于名为“sections.html”的页面中。这是你可以做你想做的事情的一种方式:

<?php


  # Create new DOM object
  $domOb = new DOMDocument();

  # Grab your HTML file
  $html = $domOb->loadHTMLFile(sections.html);

  # Remove whitespace
  $domOb->preserveWhiteSpace = false; 

  # Set the container tag
  $container = $domOb->getElementsByTagName('ul'); 

  # Loop through UL values
  foreach ($container as $row) 
  { 
      # Grab all <li>
      $items = $row->getElementsByTagName('li'); 

      # echo the values  
      echo $items->item(0)->nodeValue.'<br />'; 
      echo $items->item(1)->nodeValue.'<br />'; 
      echo $items->item(2)->nodeValue;

      # You could write to your XML file, store in a string, anything here
    } 

?>

我没有测试过这个,但这是一般的想法。

希望这会有所帮助。