如何将超链接文本嵌入到p标记文本中?

时间:2017-07-24 20:25:07

标签: web-scraping scrapy

我正在使用Scrapy并在处理超链接时遇到麻烦。该文章将有一个名称,但这将是到另一个页面的超链接。我无法弄清楚如何使用

标记文本嵌入标记文本。我正在尝试练习on this article

response.css('div.article-body p::text').extract()

2 个答案:

答案 0 :(得分:1)

您想使用css通配符选择器。

response.css('div.article-body p *::text').extract()

或者,如果您想要div.article-body中的所有内容

response.css('div.article-body *::text').extract()

答案 1 :(得分:0)

我认为更简单的方法是使用XPath函数string()normalize-space(),如:

response.css('.article-body > p').xpath('normalize-space(.)').extract()