Question

我有以下HTML：

<li class="last">
    <span>SKU:</span> 483151
</li>

我可以使用以下方式选择它们：

SKU_SELECTOR = '.aaa .bbb .last ::text'
sku = response.css(SKU_SELECTOR).extract_first().strip()

我如何才能获得该号码并忽略该范围。

Answer 1

您的css选择器在::text之前有不必要的空格。

SKU_SELECTOR = '.aaa .bbb .last ::text'
                               ^

空格表示任何后代或自身节点都有资格使用此选择器，您只想在self下选择文本。

我得到了它的工作：

>[0]: s = Selector(tex='...')
>[1]: s.css('.last::text').extract()
<[1]: [u'\n    ', u' 483151\n']