如何查找页面上的所有链接?

时间:2014-02-26 13:47:05

标签: xpath

请告诉我表达式xpath,您可以使用它找到网页上的所有项目。即我需要在任何嵌套级别找到链接。

类似地:

xpath('a')
xpath('*/a')
xpath('*/*/a')
xpath('*/*/*/a')
xpath('*/*/*/*/a')
......
.....
.........

1 个答案:

答案 0 :(得分:3)

您可以在

找到答案以及其他人的答案

http://courses.ischool.berkeley.edu/i290-14/s05/lecture-4/allslides.xhtml

基本上,您需要使用

//a

免除上述链接:

  

您可以将不是直接子项的元素与“//”匹配   (双前锋斜线)。

     

这将查看“当前上下文”的后代。

     

例如:

     

/ section //引用将匹配作为后代的所有'cite'元素   '部分'。但是:

     

//引用将匹配文档中的所有“引用”元素。