如何从scrapy的原始HTML中排除Javascript

时间:2018-10-08 14:59:59

标签: python scrapy

我正在制作一个用HTML标签刮擦该网站的刮板,但是问题是我刮擦的站点在内容之间有广告,因此XPath选择器也刮擦了我不想要的脚本。

response.xpath('//*[@class="entry-inner"]/p').extract()

那么如何从HTML中排除JavaScript?

0 个答案:

没有答案