Question

<div id="info" class="">
<span>
  <span class="pl"> author</span>:
    <a class="" href="/search/author"Peter</a>
</span><br/>
<span class="pl">publisher:</span> god cor<br/>
<span class="pl">year:</span> 2011-6<br/>
<span class="pl">page:</span> 360<br/>
<span class="pl">price:</span> 39.50<br/>

从上面的HTML标签中，我想用XPath提取这些数字。我可以这样做吗？

感谢。

Answer 1

每个号码的XPath是（按照上面的顺序）：

//*[@id="info"]/a/text()[2]         --> 2011-6
//*[@id="info"]/a/text()[3]         -->360
//*[@id="info"]/a/text()[4]         --> 39.5

只需在Chrome中打开html文件，右键单击视图并选择“检查”即可知道任何标记的XPath。当您找到所需的标签时，只需右键单击它并选择Copy-＆gt;复制XPath。

如何在没有Html标记的情况下使用XPath提取文本？

1 个答案: