如何在没有Html标记的情况下使用XPath提取文本?

时间:2016-07-29 15:58:15

标签: xpath

<div id="info" class="">
<span>
  <span class="pl"> author</span>:
    <a class="" href="/search/author"Peter</a>
</span><br/>
<span class="pl">publisher:</span> god cor<br/>
<span class="pl">year:</span> 2011-6<br/>
<span class="pl">page:</span> 360<br/>
<span class="pl">price:</span> 39.50<br/>

从上面的HTML标签中,我想用XPath提取这些数字。我可以这样做吗?

感谢。

1 个答案:

答案 0 :(得分:0)

每个号码的XPath是(按照上面的顺序):

//*[@id="info"]/a/text()[2]         --> 2011-6
//*[@id="info"]/a/text()[3]         -->360
//*[@id="info"]/a/text()[4]         --> 39.5

只需在Chrome中打开html文件,右键单击视图并选择“检查”即可知道任何标记的XPath。当您找到所需的标签时,只需右键单击它并选择Copy-&gt;复制XPath。