Scrapy - 如何拆分此表中的数据?

时间:2017-10-17 12:22:01

标签: python python-3.x xpath web-scraping scrapy

我正在尝试从表中抓取数据,但是,表数据似乎具有相同的xpath。以下是表格的示例 - http://www.hpft.nhs.uk/services/find-our-services/hertfordshire/cheshunt

当我使用response.xpath('//td/text()').extract()时,它会返回整个表格。

我想也许我可以使用绝对xpath,例如response.xpath('//tr/td[3]/text()').extract()在示例中返回['01992 818600', '01707 364012', '01707 364003'] - 从理论上讲,这应该是整个站点中所有表的动态吗?

但是,我想要做的是将每个表条目的服务,地址和电话添加为输出csv文件中的单独行。但我无法弄清楚如何拆分我的回复中的列表数据?我已经设置了我想要使用的项目。

1 个答案:

答案 0 :(得分:1)

您应该遍历表格行,然后将单个字段收集到项目中:

feed_dict