应用错误收集

我正在尝试在网页的<td></td>中抓取文本，它是xpath：//table[@id = 'sth']/tbody/tr[2]/td[2]。我使用selenium访问该页面。

但是问题是当我使用response.xpath('//table[@id = 'sth']/tbody/tr[2]/td[2]/text()').extract_first()或response.xpath('//table[@id = 'sth']/tr[2]/td[2]/text()').extract_first()时，scrapy无法提取文本，它只返回None。

然后，我尝试使用self.driver.find_element_by_xpath('//table[@id = 'sth']/tbody/tr[2]/td[2]').text（与td_path中使用的response.xpath()相同）提取文本，

我还将网页的HTML标签复制到html文件中，在cmd中使用scrapy shell打开文件，使用response.xpath('//table[@id = 'sth']/tr[2]/td[2]/text()').extract_first()提取文本。有用。

我只是不知道为什么抓取页面时response.xpath（）不起作用。

scrapy response.xpath无法提取表字段的文本，但是硒find_find_elements_by_xpath（）可以

0 个答案: