使用lxml.html.xpath遍历父级

时间:2014-03-04 16:45:30

标签: python lxml lxml.html

我们如何在xpath中遍历回父?

我正在抓取IMDB,获取电影类型,我正在使用

elem = hxs.xpath('//*[@id="titleStoryLine"]/div/h4[text()="Genres:"]')

现在,类型被列为锚链接,它是此标记的兄弟。怎么能实现呢?

2 个答案:

答案 0 :(得分:2)

这将选择您提供的XPath表达式的父元素:

//*[@id="titleStoryLine"]/div/h4[text()="Genres:"]/..

答案 1 :(得分:2)

对于lxml 内置的ElementTree),父元素位于元素中。你可以这样得到它:

parent = elem.getparent()

然后从那里看你需要什么。