如何从html中搜索表数据

时间:2016-06-03 09:28:22

标签: python xpath scrapy html-table

我有一个来自HTML的scrapy多表。跟随图片的示例:

enter image description here

我只从桌子[6] ----桌子[20] ....

写下面的xpath get table [6] .. table [20]不起作用。

def parse_item(self, response):
        trs = response.xpath("/html/body/table[4]/tr/td[1]/table")
        for i in trs:
            item = CompanyItem()
            item['collection_dt'] = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(time.time()))
            item['company_hangye'] = '新能源(储能,太阳能,风能,光伏,新材料等)'
            item['company_quyue'] = i.xpath("/tr/td[1]/table[1]/tr/td[1]/text()").extract()
            item['company_name'] = i.xpath("/tr//td[1]/table[1]/tr/td[1]/strong/a/text()").extract_first()
            item['company_product'] = i.xpath("/tr//td[1]/table[4]/tr/td[1]/text()").extract()
            item['company_qiyeleixing'] = i.xpath("/tr//td[1]/table[5]/tr/td[2]/text()").extract()
            item['company_description'] = i.xpath("/tr//td[1]/table[2]/tr/td[1]/text()").extract()
            lianxi = i.xpath("/tr/td[1]/table[3]/tr/td[1]/text()").extract()
            item['company_lianxi_emp_name'] = lianxi[1]
            item['company_lianxi_tel'] = lianxi[2]
            item['company_lianxi_mobile'] = lianxi[3]
            return item

0 个答案:

没有答案