使用XPath获取某些属性值

时间:2010-02-11 08:29:35

标签: python xpath

来自以下HTML代码段:

<link rel="index" href="/index.php" />
<link rel="contents" href="/getdata.php" />
<link rel="copyright" href="/blabla.php" />
<link rel="shortcut icon" href="/img/all/favicon.ico" />

我正在尝试使用rel值= href获取link标记的"shortcut icon"值,我正在尝试使用XPath实现这一点。

如何在Python中执行此操作?

1 个答案:

答案 0 :(得分:16)

像这样:

data = """<link rel="index" href="/index.php" />
<link rel="contents" href="/getdata.php" />
<link rel="copyright" href="/blabla.php" />
<link rel="shortcut icon" href="/img/all/favicon.ico" />
"""

from lxml import etree

d = etree.HTML(data)

d.xpath('//link[@rel="shortcut icon"]/@href')
['/img/all/favicon.ico']