我使用Selenium和ChromeDriver获取网站的html正文。
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
options = Options()
options.add_argument('--headless')
options.add_argument('--window-size=1920,1080')
options.add_argument('--disable-gpu')
driver = webdriver.Chrome(executable_path=r"C:\Users\ivan.nadin\Desktop\ProcurementCollector\procurement\procurement\chromedriver.exe",chrome_options=options)
driver.set_page_load_timeout(10)
driver.get('https://sevkab.nt-rt.ru/')
print(driver.page_source.encode("utf-8"))
ChromeDriver在正常模式下工作,但是当我设置了无头模式时,我会收到错误消息(这是该站点不起作用,其他都可以):
TimeoutException: Message: timeout
(Session info: headless chrome=73.0.3683.103)
(Driver info: chromedriver=73.0.3683.68
(47787ec04b6e38e22703e856e101e840b65afe72),platform=Windows NT 10.0.17134
x86_64)