在html表中使用lxml获取href的值

时间:2012-05-01 06:23:56

标签: python html lxml

我有一张html表。
在那张桌子里我有

<td>abc</td><a>www.abc.com</a>  

如何使用匹配td的值来获取链接值?

例如:如何使用lxml获取www.abc.com搜索tect abc的值?

1 个答案:

答案 0 :(得分:3)

a/text()获取文字

a/@href获取attr(在这种情况下为href

<强> UPD

>>> from lxml import etree
>>> etree.fromstring('<html><td>abc</td><a>www.abc.com</a></html>').xpath("//td/following-sibling::a/text()")
['www.abc.com']

XPath 1.0