Scrapy - 获取选择器中的所有数据

时间:2015-07-23 11:39:24

标签: xpath scrapy

如果我在响应中有一些HTML:

<body>
    Body text
    <div>
        Div text
    </div>
</body>

如果我response.xpath('//body/text()').extract()我将只获得[Body text]

我希望<body>内的一切包括标签,即整个事情:

Body text
<div>
    Div text
</div>

我该如何实现?

谢谢。

2 个答案:

答案 0 :(得分:1)

试一试:

response.xpath('//body/node()/text()')

或者如果您也想要标签:

response.xpath('//body/node()')

答案 1 :(得分:0)

尝试

//body/(descendant::text() | following::text())

//body/descendant::text() | //body/following::text()