粗鲁的响应变得肮脏,xpath不起作用

时间:2019-10-30 12:19:27

标签: web-scraping scrapy

你好吗? 如下面的图片所示,我的Scrapy响应非常脏,并且没有xpath起作用。在Spider中,我只是进行身份验证,发送请求并显示response.body。 如何进行?

草率的响应:

Image Scrapy Response

1 个答案:

答案 0 :(得分:1)

使用XPath和表的最常见错误是现代浏览器自动将tbody标记添加到DOM 。这就是为什么您需要在使用任何标记之前始终检查源代码的原因。

尝试不使用tbody

//table[.//tr[td[b[contains(text(), "Nome do Plano")]]]]/tr