XPath获取标记X中的所有信息,但标记Y中的信息除外

时间:2012-12-03 03:14:29

标签: xpath

在下面的代码中,如何使用Xpath获取class ='pageHeading'中的所有信息,而不抓取<span>标记中的任何数据?

我所追求的信息很简单:'闪亮发饰'

这是我到目前为止所尝试的:

//*[@class='pageHeading' | //*[not(contains(@class, 'smallText'))]
//*[@class='pageHeading' and //*[not(contains(@class, 'smallText'))]

这是我正在处理的代码:

<td class="pageHeading" valign="top">
    Shiny Hair Accessories
   <br>
   <span class="smallText">[10672]</span>
   <br>
    <span class="smallText">UPC no. : 817953901653672</span>
</td>

1 个答案:

答案 0 :(得分:1)

我明白了。 text()函数获得属于具有类“pageHeading”的元素的第一层文本,同时忽略了span标记,就像我需要的那样。

//td[@class = 'pageHeading']/text()