如何在python中使用urllib下载网页(mhtml格式)

时间:2017-03-23 05:20:34

标签: python python-2.7 python-3.x selenium urllib

我们如何使用python语言中的urllib保存包含其中内容的网页,以便可以脱机查看?目前我使用以下代码:

import urllib.request 

driver.webdriver.Chrome()
driver.get("http://www.yahoo.com")
urllib.request.urlretrieve("http://www.yahoo.com", C:\\Users\\karanjuneja\\Downloads\\kj\\yahoo.mhtml")

这可以在文件夹中找到并编辑mhtml版本的网页,但是当你打开文件时,你只能找到所写的代码而不是网页在线显示的方式。我们需要更改代码吗? 此外,还有另一种方法可以保存MHTML格式的网页,其中包含在线显示的所有内容,而不仅仅是源。任何建议? 谢谢卡兰

1 个答案:

答案 0 :(得分:0)

我想这个网站可能对你有所帮助〜 Create an MHTML archive