Question

<p>abc</p> 
<p>c<strong>d<\/strong></p>

我尝试使用xpath提取p标记内的全文。我使用表达式//div[@id='artibody']/p//text()，但我无法恢复原始句子顺序。结果是['abc', 'c', 'd']。

Answer 1

这应该有效：string-join(//div[@id='artibody']/p//text(), "")

返回：abccd

//忽略子标记，string-join连接结果。

如果要添加木工字符串，请使用第二个参数：

string-join(//div[@id='artibody']/p//text(), "-")

返回：abc-c-d

请参阅here以获取解释。