从降序元素和元素本身中选择文本

时间:2017-01-09 17:53:26

标签: python xpath web-scraping scrapy

我想从降序元素和元素本身中选择文本。什么xpath选择器可以执行此操作以及如何组合所有文本部分?

1 个答案:

答案 0 :(得分:2)

您要找的是//text()

采取from w3schools

  

// - 从当前节点中选择与选择匹配的文档中的节点,无论它们在何处

示例:

$ scrapy shell
In [1]: data = """
   ...: <div> root text
   ...: <div> level 2 text </div>
   ...: <div> level 2 text2 </div>
   ...: </div>
   ...: """
In [2]: from scrapy import Selector
In [3]: sel = Selector(text=data)
In [4]: sel.xpath("//div//text()").extract()
Out[4]: [u' root text\n', u' level 2 text ', u'\n', u' level 2 text2 ', u'\n']