爬网表链接时出现错误“ selenium.common.exceptions.InvalidSessionIdException:消息:无效的会话ID”

时间:2019-09-16 09:30:18

标签: python-3.x beautifulsoup selenium-chromedriver

试图抓取table-tr-td [2]中给出的链接,但遇到以下错误--selenium.common.exceptions.InvalidSessionIdException:消息:无效的会话ID。

我曾经尝试过使用Selenium Webdriver,但没有发现出现渗透错误的问题。

    from bs4 import BeautifulSoup
    from selenium import webdriver

    url="https://www.zaubacorp.com/company-list"

    driver = webdriver.Chrome(r'C:\chromedriver.exe')
    driver.get(url)

    driver.close()

    soup = BeautifulSoup(driver.page_source,'html.parser')
    table = soup.find('table',{'id':'table'})
    body = table.find('tbody')
    for links in body.find_all('a'):
        print(links['href'])

请帮助我解决这个问题。谢谢。

1 个答案:

答案 0 :(得分:0)

您是在获取page_source值之前关闭的浏览器,因此硒无法获取会话。立即尝试。

from bs4 import BeautifulSoup
from selenium import webdriver

url="https://www.zaubacorp.com/company-list"
driver = webdriver.Chrome(r'C:\chromedriver.exe')
driver.get(url)
soup = BeautifulSoup(driver.page_source,'html.parser')
driver.close()
table = soup.find('table',{'id':'table'})
body = table.find('tbody')
for links in body.find_all('a'):
 print(links['href'])