这是我当前的代码:
links = browser.find_elements_by_xpath("//a[@href]")
for link in links:
print(link.get_attribute("href"))
我只想在我要抓取的特定页面上提取包含“ instagram”的链接。
该链接通常是这样的:
https://www.instagram.com/(username/
我只想抓取并在控制台上打印。我该怎么办?
谢谢!
答案 0 :(得分:0)
links = browser.find_elements_by_xpath('//a[@href]')
for link in links:
href = link.get_attribute('href')
if 'instagram' in href:
print(href)
答案 1 :(得分:0)
这也应该起作用。具有特定谓词的XPath:
links = browser.find_elements_by_xpath('//a[contains(@href,"instagram")]')
for link in links:
print(link.get_attribute("href"))