在下面的代码中,如何使用Xpath获取class ='pageHeading'中的所有信息,而不抓取<span>
标记中的任何数据?
我所追求的信息很简单:'闪亮发饰'
这是我到目前为止所尝试的:
//*[@class='pageHeading' | //*[not(contains(@class, 'smallText'))]
//*[@class='pageHeading' and //*[not(contains(@class, 'smallText'))]
这是我正在处理的代码:
<td class="pageHeading" valign="top">
Shiny Hair Accessories
<br>
<span class="smallText">[10672]</span>
<br>
<span class="smallText">UPC no. : 817953901653672</span>
</td>
答案 0 :(得分:1)
我明白了。 text()函数获得属于具有类“pageHeading”的元素的第一层文本,同时忽略了span标记,就像我需要的那样。
//td[@class = 'pageHeading']/text()