如果我在响应中有一些HTML:
<body>
Body text
<div>
Div text
</div>
</body>
如果我response.xpath('//body/text()').extract()
我将只获得[Body text]
我希望<body>
内的一切包括标签,即整个事情:
Body text
<div>
Div text
</div>
我该如何实现?
谢谢。
答案 0 :(得分:1)
试一试:
response.xpath('//body/node()/text()')
或者如果您也想要标签:
response.xpath('//body/node()')
答案 1 :(得分:0)
尝试
//body/(descendant::text() | following::text())
或
//body/descendant::text() | //body/following::text()