我正在尝试在网页的<td></td>
中抓取文本,它是xpath://table[@id = 'sth']/tbody/tr[2]/td[2]
。我使用selenium
访问该页面。
但是问题是当我使用response.xpath('//table[@id = 'sth']/tbody/tr[2]/td[2]/text()').extract_first()
或response.xpath('//table[@id = 'sth']/tr[2]/td[2]/text()').extract_first()
时,scrapy无法提取文本,它只返回None
。
然后,我尝试使用self.driver.find_element_by_xpath('//table[@id = 'sth']/tbody/tr[2]/td[2]').text
(与td_path
中使用的response.xpath()
相同)提取文本,
我还将网页的HTML标签复制到html文件中,在cmd中使用scrapy shell
打开文件,使用response.xpath('//table[@id = 'sth']/tr[2]/td[2]/text()').extract_first()
提取文本。有用。
我只是不知道为什么抓取页面时response.xpath()不起作用。