试图抓取table-tr-td [2]中给出的链接,但遇到以下错误--selenium.common.exceptions.InvalidSessionIdException:消息:无效的会话ID。
我曾经尝试过使用Selenium Webdriver,但没有发现出现渗透错误的问题。
from bs4 import BeautifulSoup
from selenium import webdriver
url="https://www.zaubacorp.com/company-list"
driver = webdriver.Chrome(r'C:\chromedriver.exe')
driver.get(url)
driver.close()
soup = BeautifulSoup(driver.page_source,'html.parser')
table = soup.find('table',{'id':'table'})
body = table.find('tbody')
for links in body.find_all('a'):
print(links['href'])
请帮助我解决这个问题。谢谢。
答案 0 :(得分:0)
您是在获取page_source值之前关闭的浏览器,因此硒无法获取会话。立即尝试。
from bs4 import BeautifulSoup
from selenium import webdriver
url="https://www.zaubacorp.com/company-list"
driver = webdriver.Chrome(r'C:\chromedriver.exe')
driver.get(url)
soup = BeautifulSoup(driver.page_source,'html.parser')
driver.close()
table = soup.find('table',{'id':'table'})
body = table.find('tbody')
for links in body.find_all('a'):
print(links['href'])