我有一个xpath表达式,它使用“|” - 运算符来选择网页的几个节点/ div。
这是表达式:
hxs.select('//div[@class="cat"]/p|//div[@class="entry"]').extract()
但是当我输出结果时,我在第一个表达式
的输出之间得到一个逗号//div[@class="cat"]/p
和第二个
//div[@class="entry"]
喜欢:
'Lorem ipsum', 'Ipsum Lorem'
有没有办法摆脱逗号?
像:
'Lorem ipsum Ipsum lorem'
或者是否有更好的方法来编写选择THIS div和THIS div的xpath表达式。
应用程序的其余部分是用Python编写的,但我不认为这与问题有关。任何帮助非常感谢!
答案 0 :(得分:1)
使用join()
。
" ".join(hxs.select('//div[@class="cat"]/p|//div[@class="entry"]').extract())