Question

我正在为SuperLawyers.com搜索律师的姓名和地址信息。除了电话号码之外，它正在抓取所有正确的数据。个人资料页面有两次电话号码，当然我很高兴提取其中任何一个。页面示例：

我的xPath：phone = response.xpath('//div[@id="lawyer_phone_button"]//text()').extract()

Answer 1

在这种情况下，您不应跳过a标记。使用以下

phone = response.xpath('//div[@id="lawyer_phone_button"]/a/text()').extract()

适用于您发布的页面