标签: python scrapy
我正在制作一个用HTML标签刮擦该网站的刮板,但是问题是我刮擦的站点在内容之间有广告,因此XPath选择器也刮擦了我不想要的脚本。
response.xpath('//*[@class="entry-inner"]/p').extract()
那么如何从HTML中排除JavaScript?