硒驱动程序不保存网页内容

时间:2018-10-17 11:05:59

标签: python-3.x selenium-webdriver

下面的代码正在创建一个空的task_list.html文件。它没有保存完整的html内容文件,这是我想要的。如何解决?

from selenium import webdriver
import codecs
driver = webdriver.Firefox()
html = driver.page_source
driver.get("<our_internal_work_website>")
with open(r"C:\Users\task_list.html", "wb") as f:
 f.write(html.encode('utf-8'))

几点:

  1. 我是Python的新手,几天后才开始学习,并通过搜索stackoverflow来解决问题。

  2. 我正在Windows 10中Powershell的交互式shell上运行此代码。

  3. 打开时,我手动输入登录凭据。我仍然没有能够自动输入登录详细信息的专业知识。

  4. 我不具备html / css知识,因此Google会四处搜寻以便进行故障排除。

  5. 我想使用漂亮的汤来解析html,但是它也需要登录凭据,而且我不知道将登录凭据放在哪里,因为它没有明确打开“ Firefox”浏览器。因此,我现在正在使用Selenium,因为它可以打开Firefox浏览器。

0 个答案:

没有答案