Question

<tr><td class=term>1st param</td>
    <td>PUTIN 
        <div class='info-icon'>
            <a href='#' onmouseover='show_pd(351);' onmouseout='hide_pd(351);' id='info-icon-351'></a>
        </div>
        <div id='pd-351' style='display: none; position: absolute;'>
        <b>СПРАВКА</b>
        <br /><br />
            <P align=justify><NOBR><STRONG>ABS</STRONG></NOBR>bla-bla-bla text</P>
            <P align=justify>bla-bla-bla text 2</P>
            <P align=justify>bla-bla-bla text 3</P>
            <P align=justify>bla-bla-bla text 4</P>
        </div> 
</td>

我只需要提取物＆＃34; PUTIN＆＃34;。现在我

//td[@class="term"][contains(text(), "1st param")]/following-sibling::td/[not(self::p)]

Answer 1

在XPath之后对XML进行一些调整

//td[@class="term"][contains(text(), "1st param")]/following-sibling::td/node()[1]

的输出为PUTIN

调整是将<td class=term>更改为<td class="term">，将所有<P align=justify>更改为<P align="justify">（对于您的设置可能不是必需的，但我刚刚使用的XPath评估程序是必需的）。

不使用<div>提取文本，使用xpath </p> </div>提取<p>

1 个答案: