在xpath中使用“或”运算符时合并输出

时间:2012-07-20 17:20:16

标签: python xpath

我有一个xpath表达式,它使用“|” - 运算符来选择网页的几个节点/ div。

这是表达式:

hxs.select('//div[@class="cat"]/p|//div[@class="entry"]').extract()

但是当我输出结果时,我在第一个表达式

的输出之间得到一个逗号
//div[@class="cat"]/p

和第二个

//div[@class="entry"]

喜欢:

'Lorem ipsum', 'Ipsum Lorem'

有没有办法摆脱逗号?

像:

'Lorem ipsum Ipsum lorem'

或者是否有更好的方法来编写选择THIS div和THIS div的xpath表达式。

应用程序的其余部分是用Python编写的,但我不认为这与问题有关。任何帮助非常感谢!

1 个答案:

答案 0 :(得分:1)

使用join()

" ".join(hxs.select('//div[@class="cat"]/p|//div[@class="entry"]').extract())