Xpath获取完整的<p>,包括<a>

时间:2019-07-09 16:14:41

标签: xpath

我有以下HTML代码:

<p class="article-text">Text1 <a href="LINK" target="_blank">LinkText</a> Text2.</p>

我想提取完整的<p>文字,包括。 LinkText,如果有的话(并非在所有情况下)。

预期:“ Text1 LinkText Text2。

我尝试了(//p)[2]

但这只是显示<a>打开时“ Text1”结尾。

也尝试过(//p)[2]|(//p)[2]/child::node(),但是它以</a>结尾,我不知道如何提取其余<p>

<a>中可能没有<p>,也可能其中有2 <a>

2 个答案:

答案 0 :(得分:0)

您的xpath应该是。

//p[@class='article-text']

答案 1 :(得分:0)

尝试使用string()函数。

string(//p)

或更具体的

string(//p[@class='article-text'])