使用PHP获取DOM元素

时间:2011-11-15 22:28:40

标签: php html dom tags

我很难理解如何在PHP中使用DOMElement对象。我找到了这段代码,但我不确定它是否适用于我:

$dom = new DOMDocument();
$dom->loadHTML("index.php");

$div = $dom->getElementsByTagName('div');
foreach ($div->attributes as $attr) {
     $name = $attr->nodeName;
     $value = $attr->nodeValue;
     echo "Attribute '$name' :: '$value'<br />";
}

基本上我需要的是在DOM中搜索具有特定element的{​​{1}},之后我需要提取一个非标准的id(即我制作的那个)起来并穿上JS)所以我可以看到它的价值。原因是我需要attribute中的一个部分和基于重定向的HTML中的一个部分。如果有人可以解释我如何将DOMDocument用于此目的,那将会有所帮助。我真的在努力了解正在发生的事情以及如何正确实施它,因为我显然做得不对。

编辑(根据评论我在哪里):

这是我的代码行4-26供参考:

$_GET

以下是我收到的错误消息:

<div id="column_profile">
    <?php
        require_once($_SERVER["DOCUMENT_ROOT"] . "/peripheral/profile.php");            
        $searchResults = isset($_GET["s"]) ? performSearch($_GET["s"]) : "";

        $dom = new DOMDocument();
        $dom->load("index.php");

        $divs = $dom->getElementsByTagName('div');
        foreach ($divs as $div) {
            foreach ($div->attributes as $attr) {
              $name = $attr->nodeName;
              $value = $attr->nodeValue;
              echo "Attribute '$name' :: '$value'<br />";
            }
        }
        $div = $dom->getElementById('currentLocation');
        $attr = $div->getAttribute('srckey');   
        echo "<h1>{$attr}</a>";
    ?>
</div>

<div id="column_main">

2 个答案:

答案 0 :(得分:20)

getElementsByTagName会返回一个元素列表,因此首先需要遍历元素,然后遍历它们的属性。

$divs = $dom->getElementsByTagName('div');
foreach ($divs as $div) {
    foreach ($div->attributes as $attr) {
      $name = $attr->nodeName;
      $value = $attr->nodeValue;
      echo "Attribute '$name' :: '$value'<br />";
    }
}

在您的情况下,您说您需要一个特定的ID。这些应该是唯一的,所以要这样做,你可以使用(注意getElementById可能不起作用,除非你先调用$dom->validate()):

$div = $dom->getElementById('divID');

然后获取你的属性:

$attr = $div->getAttribute('customAttr');

编辑$dom->loadHTML只是读取文件的内容,它不会执行它们。 index.php不会以这种方式运行。您可能需要执行以下操作:

$dom->loadHTML(file_get_contents('http://localhost/index.php'))

答案 1 :(得分:2)

如果重定向来自外部服务器,则无法访问HTML。让我这样说吧:在你试图解析它时,DOM不存在。你可以做的是将文本传递给DOM解析器,然后以这种方式操作元素。或者更好的方法是将其添加为另一个GET变量。

编辑:您是否也知道客户端可以更改HTML并让它通过他们想要的任何内容? (使用像Firebug这样的工具)