用于从自身和子节点提取文本的xpath

时间:2014-06-26 10:06:08

标签: html xpath domxpath

这是我的情况

我想选择“购买2只小山猫咪维持轻量级10公斤并再保存4.00英镑!”仅来自风暴

注意:我正在使用XPath 1.0

<div>
    <a>
        <b>
            <u>Multi-Buy:</u>
        </b>
        <br/>
        Buy 
        <b>2</b>
         Hills Feline Maint Light 10kg and 
        <b>
            <font color="#CC0000">Save a further £4.00!</font>
        </b>
        <br/>
        <i>Simply add 2 to your basket.</i>
    </a>
</div>

这是我的努力

//div/a/text()

使用这个我缺少子节点文本

/div/a//text()

如果我使用这个,我会得到额外的文字

1 个答案:

答案 0 :(得分:0)

由于这个HTML没有以任何方式构建,以便以任何干净的方式提取它,我建议如下:

/div/a//text()[not(. = 'Multi-Buy:' or contains(., 'to your basket'))]