scrapy response.xpath无法提取表字段的文本,但是硒find_find_elements_by_xpath()可以

时间:2018-06-20 13:25:08

标签: python selenium xpath scrapy response

我正在尝试在网页的<td></td>中抓取文本,它是xpath://table[@id = 'sth']/tbody/tr[2]/td[2]。我使用selenium访问该页面。

但是问题是当我使用response.xpath('//table[@id = 'sth']/tbody/tr[2]/td[2]/text()').extract_first()response.xpath('//table[@id = 'sth']/tr[2]/td[2]/text()').extract_first()时,scrapy无法提取文本,它只返回None

然后,我尝试使用self.driver.find_element_by_xpath('//table[@id = 'sth']/tbody/tr[2]/td[2]').text(与td_path中使用的response.xpath()相同)提取文本,

我还将网页的HTML标签复制到html文件中,在cmd中使用scrapy shell打开文件,使用response.xpath('//table[@id = 'sth']/tr[2]/td[2]/text()').extract_first()提取文本。有用。

我只是不知道为什么抓取页面时response.xpath()不起作用。

0 个答案:

没有答案