我正在使用Scrapy并在处理超链接时遇到麻烦。该文章将有一个名称,但这将是到另一个页面的超链接。我无法弄清楚如何使用
标记文本嵌入标记文本。我正在尝试练习on this article。
response.css('div.article-body p::text').extract()
答案 0 :(得分:1)
您想使用css通配符选择器。
response.css('div.article-body p *::text').extract()
或者,如果您想要div.article-body中的所有内容
response.css('div.article-body *::text').extract()
答案 1 :(得分:0)
我认为更简单的方法是使用XPath函数string()
或normalize-space()
,如:
response.css('.article-body > p').xpath('normalize-space(.)').extract()