Scrapy .css仅选择没有属性的div元素

时间:2018-01-23 12:37:34

标签: jquery scrapy web-crawler scrapy-spider

我正在尝试获取没有附加属性的div元素,例如: -

<div class="test">
    <div>test</div>
    <div class="inside">test2</div>
    <div>test3</div>
    <div class="hello">test4</div>
    <div>test5</div>
    <div>test6</div>
</div>

作为scrapy选择器的结果,我想要以下结果。

[test, test3, test5, test6]

一个简单的div选择器不起作用。那我怎么从这里挺身而出呢?

2 个答案:

答案 0 :(得分:1)

我认为仅使用css选择器无法实现这一目标,但您也可以xpath使用scrapy

response.xpath('//div[not(@*)]')

答案 1 :(得分:1)

您可以使用CSS :not选择器执行此操作;

div {
  background: red;
}

div:not([class]) {
  background: green;
}

像这样,没有课程的任何div都是绿色的。

View on Codepen