php domDocument xpath从表中提取链接

时间:2013-12-18 10:15:49

标签: php xpath domdocument

我正在尝试使用domDocument和xpath来提取表的内容,包括某些单元格中链接的href属性。以下代码绘制了一个空白。

<?php
$url_content='<html>
<body>
<table class="txtable">
<tbody>
    <tr>
        <th>Col 1</th>
        <th>Col 2</th>
        <th>Col 3</th>
        <th>Col 4</th>
    </tr> 
    <tr>
        <td><a href="www.example1.com">link 1</a></td>
        <td>31</td>
        <td>34</td>
        <td>Blue</td>
    </tr> 
    <tr>
        <td><a href="www.example2.com">link 2</a></td>
        <td>41</td>
        <td>44</td>
        <td>Red</td>
    </tr>
</tbody>
</table>
</body>
</html>';

$doc = new DOMDocument();
@$doc->loadHTML($url_content);

$finder = new DomXPath($doc);
$rows = $finder->query("//table[@class='txtable']/tbody/tr");

foreach ($rows->childNodes AS $row){
foreach($row->childNodes AS $cell){
    if (($cell->nodeName == "td") OR ($cell->nodeName == "th")){

        echo $cell->nodeValue."<br>";   
    } else {
        echo $cell->getAttribute('href')."<br>";
    }
}
}

我担心我不理解xpath或domDocument的基本内容。帮助赞赏。

我期望$ rows成为行的集合,我可以使用foreach迭代。 echo语句应该显示每个的内容。

如果孩子不是'td'或'th',在这种情况下它必须是'a'然后我想要回显出href属性

我在浏览器中一无所获

如果我从php运行,我会

PHP注意:未定义的属性:第35行的/var/www/follow/php/domtest.php中的DOMNodeList :: $ childNodes PHP警告:在第35行的/var/www/follow/php/domtest.php中为foreach()提供的参数无效

1 个答案:

答案 0 :(得分:0)

foreach ($rows->childNodes AS $row){

应该是

foreach ($rows as $row){