如何使用硒提取特定链接?

时间:2020-05-10 02:55:36

标签: python selenium xpath

这是我当前的代码:

links = browser.find_elements_by_xpath("//a[@href]")

for link in links:
    print(link.get_attribute("href"))

我只想在我要抓取的特定页面上提取包含“ instagram”的链接。

该链接通常是这样的:

https://www.instagram.com/(username/

我只想抓取并在控制台上打印。我该怎么办?

谢谢!

2 个答案:

答案 0 :(得分:0)

links = browser.find_elements_by_xpath('//a[@href]')

for link in links:
    href = link.get_attribute('href')
    if 'instagram' in href:
        print(href)

答案 1 :(得分:0)

这也应该起作用。具有特定谓词的XPath:

links = browser.find_elements_by_xpath('//a[contains(@href,"instagram")]')

for link in links:
    print(link.get_attribute("href"))