xPath特定元素

时间:2017-09-27 13:47:36

标签: xpath scrapy

我正在为SuperLawyers.com搜索律师的姓名和地址信息。除了电话号码之外,它正在抓取所有正确的数据。个人资料页面有两次电话号码,当然我很高兴提取其中任何一个。页面示例:

https://profiles.superlawyers.com/massachusetts/somerville/lawyer/wyckoff-nissenbaum/e854f9a4-28d2-46e6-bf69-dee74c7ffdb1.html

我的xPath:phone = response.xpath('//div[@id="lawyer_phone_button"]//text()').extract()

1 个答案:

答案 0 :(得分:1)

在这种情况下,您不应跳过a标记。使用以下

phone = response.xpath('//div[@id="lawyer_phone_button"]/a/text()').extract()

适用于您发布的页面