如何排除总跨度标签,即我只希望排除此p标签跨度标签内的p标签中的文本

时间:2019-06-07 11:26:43

标签: python xpath web-scraping scrapy web-crawler

enter image description here

我需要使用刮擦代码在p标签内的文本(不包括span标签)。

我在图片中附加了html路径,请找到它并为我提供帮助。

response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()

错误:

  File "<console>", line 1
    response.xpath('//*[@id="post-55812"]/div/p').not(span::text).extract()[1:11]))
                                                    ^
SyntaxError: invalid syntax

1 个答案:

答案 0 :(得分:0)

这应该有效

response.css('#post-55812 > div > p:not(span)').extract()