Question

这是我当前的代码：

links = browser.find_elements_by_xpath("//a[@href]")

for link in links:
    print(link.get_attribute("href"))

我只想在我要抓取的特定页面上提取包含“ instagram”的链接。

该链接通常是这样的：

https://www.instagram.com/(username/

我只想抓取并在控制台上打印。我该怎么办？

谢谢！

Answer 1

links = browser.find_elements_by_xpath('//a[@href]')

for link in links:
    href = link.get_attribute('href')
    if 'instagram' in href:
        print(href)

Answer 2

这也应该起作用。具有特定谓词的XPath：

links = browser.find_elements_by_xpath('//a[contains(@href,"instagram")]')

for link in links:
    print(link.get_attribute("href"))

如何使用硒提取特定链接？

2 个答案: