我如何用刮板外壳使文本清洁

时间:2019-03-05 16:02:22

标签: python web-scraping scrapy

我正在尝试在scrapy shell上执行以下命令,返回此结果:

In [49]: response.css('h4.team-meta__name')[1].extract()                                                                                                                 
Out[49]:h4 class="team-meta__name" style="color: #6495ED">   <strong>Ajax</strong></h4

问题是,我只想提取<strong>标记之间的单词“ Ajax”。 我是新来的人,希望能提供一些帮助。

1 个答案:

答案 0 :(得分:0)

您需要将<strong>标记添加到选择器

response.css('h4.team-meta__name strong::text')[1].extract()