硒:从子类元素中获取href

时间:2018-09-24 14:44:45

标签: python selenium web-scraping

我需要找到href内的所有class="mozaique"

我的代码:

gfd = driver.find_elements_by_xpath('/html[1]/body[1]/div[1]/div[4]/div[2]/div[1]/div[2]/div[1]/div[1]/div[2]/div[1]')

html: enter image description here

2 个答案:

答案 0 :(得分:0)

xpath下面应该可以帮助您获取标记下的所有链接:

<div> class='mozaique'</div>

Xpath

//div[@class='mozaique']//a[contains(@href,'')]

您可以使用以下代码段打印href的内容:

links = driver.find_elements_by_xpath('//div[@class='mozaique']//a[contains(@href,'')]')

for link in links:
    print(link.get_attribute("href"))

答案 1 :(得分:0)

首先,获取您的父元素:

parent = driver.find_element_by_class_name("mozaique")

然后获取父元素中所有'a'标签的列表。

a = parent.find_elements_by_tag_name("a")

然后运行循环以打印href

for x in a:
    print(x.get_attribute("href"))