不使用<div>提取文本,使用xpath </p> </div>提取<p>

时间:2014-11-12 21:42:07

标签: xpath

<tr><td class=term>1st param</td>
    <td>PUTIN 
        <div class='info-icon'>
            <a href='#' onmouseover='show_pd(351);' onmouseout='hide_pd(351);' id='info-icon-351'></a>
        </div>
        <div id='pd-351' style='display: none; position: absolute;'>
        <b>СПРАВКА</b>
        <br /><br />
            <P align=justify><NOBR><STRONG>ABS</STRONG></NOBR>bla-bla-bla text</P>
            <P align=justify>bla-bla-bla text 2</P>
            <P align=justify>bla-bla-bla text 3</P>
            <P align=justify>bla-bla-bla text 4</P>
        </div> 
</td>

我只需要提取物&#34; PUTIN&#34;。 现在我

//td[@class="term"][contains(text(), "1st param")]/following-sibling::td/[not(self::p)]

1 个答案:

答案 0 :(得分:1)

在XPath之后对XML进行一些调整

//td[@class="term"][contains(text(), "1st param")]/following-sibling::td/node()[1]

的输出为PUTIN

调整是将<td class=term>更改为<td class="term">,将所有<P align=justify>更改为<P align="justify">(对于您的设置可能不是必需的,但我刚刚使用的XPath评估程序是必需的)。