我正在抓一个非常大的文件,当我打电话时:
page_source = driver.page_source
它冻结,无法捕获整页源。我能做些什么来缓解这个问题吗?该页面来自自动滚动,我无法访问源。
答案 0 :(得分:2)
您可以使用execute_script()
:
driver.execute_script("return document.documentElement.outerHTML;")
您也可以尝试滚动查看页脚,然后才能获取页面源:
footer = driver.find_element_by_tag_name("footer")
driver.execute_script("arguments[0].scrollIntoView();", footer)
print(driver.page_source)
当然假设有footer
元素。