我正在尝试从表中抓取数据,但是,表数据似乎具有相同的xpath。以下是表格的示例 - http://www.hpft.nhs.uk/services/find-our-services/hertfordshire/cheshunt
当我使用response.xpath('//td/text()').extract()
时,它会返回整个表格。
我想也许我可以使用绝对xpath,例如response.xpath('//tr/td[3]/text()').extract()
在示例中返回['01992 818600', '01707 364012', '01707 364003']
- 从理论上讲,这应该是整个站点中所有表的动态吗?
但是,我想要做的是将每个表条目的服务,地址和电话添加为输出csv文件中的单独行。但我无法弄清楚如何拆分我的回复中的列表数据?我已经设置了我想要使用的项目。
答案 0 :(得分:1)
您应该遍历表格行,然后将单个字段收集到项目中:
feed_dict