你能帮我解决下面这个脚本吗?
我正在尝试将网页与其文件离线存储,以便在没有使用Python的互联网连接的情况下打开它们。我可以将目标页面的源代码复制到一个文件中,并将其保存为本地PC中的“example.html”。但是我的代码不保存文件,每当我尝试使用python浏览器打开保存的html文件时,它会从互联网上加载必要的文件,加载时间太长(非常慢)。
这是原始代码的一部分:
import urllib2, codecs
def download(site):
response = urllib2.urlopen(site)
html_input = response.read()
return html_input
def derealitivise(site, html_input):
active_html = html_input.replace('<head>', '<head> <base href='+site+'>')
return active_html
def main(site, output_filename):
#try:
site_url = site.encode("utf-8")
html_input = download(site_url)
#active_html = derealitivise(site_url, active_html)
header = "<head> <base href="+site_url+">"
active_html = html_input.replace('<head>', header)
#output_file = open (output_filename, "w")
#output_file = codecs.open(output_filename, "wb", "utf-8-sig")
#output_file.write(active_html.encode("utf-8"))
#output_file.close()
with open(output_filename, 'w') as fid:
fid.write(active_html)
return "OK"