我有以下HTML代码:
<p class="article-text">Text1 <a href="LINK" target="_blank">LinkText</a> Text2.</p>
我想提取完整的<p>
文字,包括。 LinkText,如果有的话(并非在所有情况下)。
预期:“ Text1 LinkText Text2。”
我尝试了(//p)[2]
但这只是显示<a>
打开时“ Text1”结尾。
也尝试过(//p)[2]|(//p)[2]/child::node()
,但是它以</a>
结尾,我不知道如何提取其余<p>
。
此<a>
中可能没有<p>
,也可能其中有2 <a>
。
答案 0 :(得分:0)
您的xpath
应该是。
//p[@class='article-text']
答案 1 :(得分:0)
尝试使用string()
函数。
string(//p)
或更具体的
string(//p[@class='article-text'])