使用Selenium在两个标签之间获取HTML

时间:2018-02-27 11:48:42

标签: python selenium tags flat

设置

我使用Selenium获取页面上的一组链接。

页面HTML结构是平面的&#39 ;;没有缩进,没有孩子等等,看起来像,

 <h2>TAG1</h2>
 <a href...>...</a>
 'more links'
 <a href...>...</a>
 <h2>TAG2</h2>

问题

我想要获取的链接位于两个h2标记之间()。

如何告诉selenium获取TAG1TAG2之间的HTML(或直接链接)?

2 个答案:

答案 0 :(得分:3)

这个xpath应该可以解决问题

main

xpath读取所有标签,其中h2的前面是文本TAG 1,后面是文本TAG2的h2。

答案 1 :(得分:3)

此css选择器应该有效h2 ~ a 例如:(在python中)

elements = driver.find_elements_by_css_selector('h2 ~ a')
links = [x.get_attribute('href') for x in elements]