我正在为SuperLawyers.com搜索律师的姓名和地址信息。除了电话号码之外,它正在抓取所有正确的数据。个人资料页面有两次电话号码,当然我很高兴提取其中任何一个。页面示例:
我的xPath:phone = response.xpath('//div[@id="lawyer_phone_button"]//text()').extract()
答案 0 :(得分:1)
在这种情况下,您不应跳过a
标记。使用以下
phone = response.xpath('//div[@id="lawyer_phone_button"]/a/text()').extract()
适用于您发布的页面