按标签逐步执行DOMDocument标记

时间:2012-09-24 21:32:04

标签: php dom html-parsing

奇怪的是我无法找到答案,虽然看起来好像以前一直在问。我在PHP中有一个DOMDocument,我想逐步浏览每个html标记,好像它基本上是一个平面文档。我需要检查每个元素,查找标记的名称和特定的属性值。我不能在这个实例中使用xpath我不认为,因为虽然html的结构保持不变,但属性可能会有所不同,具体取决于解析doc的时间。 我的文档有点像这样

 <tr class='THIS COULD BE ONE OF THREE DIFFERENT CLASSES' id='UNIQUE ID'>
        <td class='statistics show' >
            <button class="js-hide">Show</button>
        </td>


        <td class='details'>
            <p>
                <span class='home'>
                    <a href='LINK'>TEAM 1</a>                </span>
                  <span class='COULD BE ONE OF TWO DIFFERENT CLASSES'> VARIABLE CONTENT </span>                  <span class='away'>
                    <a href='LINK'>TEAM 2</a>                </span>
                                            </p>
        </td>


    <td class='COULD BE ONE OF THREE CLASS TYPES'>
        VARIABLE CONTENT</td>

        <td class='status'>
                    </td>
    </tr>

文档周围还有其他标签,但是有一些重复的部分就像我想要提取的一样。我无法看到xpath如何允许我明智地解析这个标签是标签是我唯一的选择,但我找不到正确的方法来做到这一点。有什么建议吗?

1 个答案:

答案 0 :(得分:1)

你可以使用getElementsByTagName(*)获取所有元素并循环遍历这些元素。