我想从降序元素和元素本身中选择文本。什么xpath选择器可以执行此操作以及如何组合所有文本部分?
答案 0 :(得分:2)
您要找的是//text()
。
// - 从当前节点中选择与选择匹配的文档中的节点,无论它们在何处
示例:
$ scrapy shell
In [1]: data = """
...: <div> root text
...: <div> level 2 text </div>
...: <div> level 2 text2 </div>
...: </div>
...: """
In [2]: from scrapy import Selector
In [3]: sel = Selector(text=data)
In [4]: sel.xpath("//div//text()").extract()
Out[4]: [u' root text\n', u' level 2 text ', u'\n', u' level 2 text2 ', u'\n']