XPath:提取位于特定字符串后面的文本

时间:2018-01-06 11:33:55

标签: html wordpress xpath

我希望提取位于" Cashback&代码促销"在这段代码上:

<h1 class="title title--sec color-black col-xs-12 merchant__title hide-tablet nopadding bold-text"> Cashback &amp; codes promo Direct Energie</h1>

我只能使用以下代码完整地提取h1标签:

/html/body/div[5]/div[5]/div[5]/div[2]/div[2]/div[1]/h1

提前感谢您的帮助!

2 个答案:

答案 0 :(得分:1)

您可以使用substring-after功能:

substring-after(/html/body/div[5]/div[5]/div[5]/div[2]/div[2]/div[1]/h1,
                'Cashback & codes promo ')

请注意子字符串末尾包含的空格。

答案 1 :(得分:1)

在XPath 2.0中,我们可以尝试使用replace

replace(/html/body/div[5]/div[5]/div[5]/div[2]/div[2]/div[1]/h1,
        '^.*Cashback & codes promo\s*(.*)$'
        '$1')