我有一张html表。
在那张桌子里我有
<td>abc</td><a>www.abc.com</a>
如何使用匹配td的值来获取链接值?
例如:如何使用lxml获取www.abc.com搜索tect abc的值?
答案 0 :(得分:3)
a/text()
获取文字
a/@href
获取attr(在这种情况下为href
)
<强> UPD 强>
>>> from lxml import etree
>>> etree.fromstring('<html><td>abc</td><a>www.abc.com</a></html>').xpath("//td/following-sibling::a/text()")
['www.abc.com']