我正在构建一个网络爬虫,并且具有以下HTML代码块:
<div class = 'example-1'
<ul class = 'example-2'
<li>
<span title = 'data1' > 155 </span>
/
<span title = 'data2' > 155 </span>
我想在范围标题中刮掉数字155和145
在我使用scrapy的代码中,我将其标识为:
'size': detail.css('ul.example-2 ::text').get(),
但是它没有给我任何回报。我该如何解决?
答案 0 :(得分:2)
正确的CSS选择器是:
span[title="data1"]
span[title="data2"]
或者,您可以同时选择两者:
span[title^="data"]
我不熟悉scrapy语法,但我相信您的scrapy选择器应如下所示:
response.css('span[title^="data"]::text').getall()
其他信息:
在CSS中,方括号表示属性选择器。
您可以选择:
span[title]
span[title="data1"]
span[title^="data"]
span[title$="1"]
更多