下面的代码正在创建一个空的task_list.html文件。它没有保存完整的html内容文件,这是我想要的。如何解决?
from selenium import webdriver
import codecs
driver = webdriver.Firefox()
html = driver.page_source
driver.get("<our_internal_work_website>")
with open(r"C:\Users\task_list.html", "wb") as f:
f.write(html.encode('utf-8'))
几点:
我是Python的新手,几天后才开始学习,并通过搜索stackoverflow来解决问题。
我正在Windows 10中Powershell的交互式shell上运行此代码。
打开时,我手动输入登录凭据。我仍然没有能够自动输入登录详细信息的专业知识。
我不具备html / css知识,因此Google会四处搜寻以便进行故障排除。
我想使用漂亮的汤来解析html,但是它也需要登录凭据,而且我不知道将登录凭据放在哪里,因为它没有明确打开“ Firefox”浏览器。因此,我现在正在使用Selenium,因为它可以打开Firefox浏览器。