我正在抓页
我想提取这些数据
我从google chrome获得了xpath,这是
//*[@id="oldID"]/li[N]/em[J]
我试图得到结果。但它给了我页面中另一个元素的结果。这是![在此处输入图像说明] [2] 它的xpath是:
//*[newID"]/li[N+1]/em[J]
为什么请?
答案 0 :(得分:3)
HTML片段
<li>
<span>Dealer</span><em>Some dealer</em><br />
<span>Location </span><em>some location</em><br> <span>City </span><em>Some City</em><br> <span>Country </span><em>Some Country</em><br> <span>Telephone </span><em>0123456789</em><br> <span>Mobile </span><em>1234567890</em><br> <span>Website </span><em><a href="http://www.example.com" >http://www.example.com</a></em><br>
<br />
<a href="detail.php?id=123456">View all products</a>
</li>
如果您想选择经销商名称,我建议您在其中找到带有“经销商”字符串的span
,然后在它之后获取em
:
//span[normalize-space(.) = "Dealer"]/following-sibling::em[1]/text()