使用xpath提取URL

时间:2014-04-20 13:27:35

标签: html xpath web-scraping

我应该使用什么xpath来提取" URL"和title =" TEXT"从这个HTML代码:

<div class="VersionAnglaise"> <a href="URL" title="Version Anglaise"
 class="LienVersionAnglaise"><strong>Version anglaise</strong></a> </div> 

提前致谢。

1 个答案:

答案 0 :(得分:2)

获取标题属性:

//div[@class='VersionAnglaise']/a/@title

获取href属性:

//div[@class='VersionAnglaise']/a/@href

您可以使用XPath union(|):

组合两者
//div[@class='VersionAnglaise']/a/@title | //div[@class='VersionAnglaise']/a/@href