domdocument xpath获取第一个tr锚名称和没有id或类的href

时间:2017-05-21 12:39:46

标签: php dom xpath

原谅我的英语。

我想从第一个“tr”中读取锚名称和href。我得到的href,但不是名字......

有人可以帮助我吗?

$dom      = new domDocument;
@$dom->loadHTML($content2);
$dom->preserveWhiteSpace = true;
$xpath                   = new DOMXPath($dom);
$rows                    = $xpath->query('//tr');
foreach ($rows as $row) {
    $cols = $row->getElementsByTagName('td');
    foreach ($cols as $col) {
        $test = $col->nodeValue;
        if ($xpath->evaluate('count(./a)', $col) > 0) { // check if an anchor exists
            $link = $xpath->evaluate('string(./a/@href)', $col); // if there is, then echo the href value
        }

    }
}

<table width="100%" border="0">
    <tr>
        <td style="width:20px;"><img src="images/gfx/programm.png" style="cursor: pointer;"> </td>
        <td style="width:415px;"><a href="?id=492488" onmouseover="Kurzinfo(492488)" onmouseout="hideit(492488)">Wondershare Filmora - 8.2.2.1 Patch</a> </td>
        <td nowrap="nowrap" style="text-align:right;">Appz </td>
        <td style="width:40px;text-align:right;">220 </td>
        <td style="width:20px;"> MB </td>
        <td style="width:150px;text-align:right;" nowrap="nowrap">21.05.2017 10:23:48 Uhr </td>
    </tr>
    <tr>

2 个答案:

答案 0 :(得分:2)

我认为你想获得Wondershare Filmora - 8.2.2.1 Patch,因为你可以使用text(),即:

$dom = new domDocument;
@$dom->loadHTML($content2);
$dom->preserveWhiteSpace = true;
$xpath = new DOMXPath($dom);
$rows = $xpath->query('//tr');
foreach ($rows as $row) {
    $cols = $row->getElementsByTagName('td');
    foreach ($cols as $col) {
        $test = $col->nodeValue;
        if ($xpath->evaluate('count(./a)', $col) > 0) { // check if an anchor exists
            $link = $xpath->evaluate('string(./a/@href)', $col); // get the href value
            $text = $xpath->evaluate('string(./a/text())', $col); // get the href text value
        }
    }
}

PHP Demo

答案 1 :(得分:1)

  

我想从第一个“tr”中读取锚名称和href。我得到的href,但不是名字

第一个tr可以表示为//table//tr[1]。同样,可以使用tr表达式获取第一个(//table//tr[1]/td//a)[1]的第一个锚点,例如:

$anchor_list = $xpath->query('(//table//tr[1]/td//a)[1]');

其中$anchor_listDOMNodeList的实例,或FALSE。可以使用DOMElement运算符访问元素([]的实例)。

if ($anchor_list && $anchor_list->length) {
  $a = $anchor_list[0];
}

拥有DOMElement,我们可以通过attributes属性轻松访问其属性:

$href = $a->attributes->getNamedItem('href');

var_dump($href ? $href->textContent : "(none)");
var_dump($name ? $name->textContent : "(none)");

如果要获取锚节点的内部文本,请使用textContent属性:

var_dump($a->textContent);