查找具有特定文字的href子级

时间:2018-12-01 15:57:47

标签: python python-3.x lxml

我希望提取一组页面上的链接。有时,此链接在页面上的定义为:

//*[@id="mainlist"]/dl/dt[3]/a

,有时也可能是:

//*[@id="mainlist"]/dl[2]/dt[2]/a

与链接关联的文本始终为“我的特殊链接”。

是否可以匹配具有文本“我的特殊链接”的//*[@id="mainlist"]的href子项?

1 个答案:

答案 0 :(得分:1)

是的,您可以这样做:

"//*[@id="mainlist"]//a[text()="My special link"]"

使用cssselect可以执行

"#mainlist a:contains("My special link")"