Question

我有以下HTML代码：

<p class="article-text">Text1 <a href="LINK" target="_blank">LinkText</a> Text2.</p>

我想提取完整的<p>文字，包括。 LinkText，如果有的话（并非在所有情况下）。

预期：“ Text1 LinkText Text2。”

我尝试了(//p)[2]

但这只是显示<a>打开时“ Text1”结尾。

也尝试过(//p)[2]|(//p)[2]/child::node()，但是它以</a>结尾，我不知道如何提取其余<p>。

此<a>中可能没有<p>，也可能其中有2 <a>。

Answer 1

您的xpath应该是。

//p[@class='article-text']

Answer 2

尝试使用string()函数。

string(//p)

或更具体的

string(//p[@class='article-text'])