设置
我使用Selenium获取页面上的一组链接。
页面HTML结构是平面的&#39 ;;没有缩进,没有孩子等等,看起来像,
<h2>TAG1</h2>
<a href...>...</a>
'more links'
<a href...>...</a>
<h2>TAG2</h2>
问题
我想要获取的链接位于两个h2
标记之间(不)。
如何告诉selenium获取TAG1
和TAG2
之间的HTML(或直接链接)?
答案 0 :(得分:3)
这个xpath应该可以解决问题
main
xpath读取所有标签,其中h2的前面是文本TAG 1,后面是文本TAG2的h2。
答案 1 :(得分:3)
此css选择器应该有效h2 ~ a
例如:(在python中)
elements = driver.find_elements_by_css_selector('h2 ~ a')
links = [x.get_attribute('href') for x in elements]