使用Python网页(包含必要的文件)离线

时间:2015-05-03 07:01:52

标签: python python-2.7

你能帮我解决下面这个脚本吗?

我正在尝试将网页与其文件离线存储,以便在没有使用Python的互联网连接的情况下打开它们。我可以将目标页面的源代码复制到一个文件中,并将其保存为本地PC中的“example.html”。但是我的代码不保存文件,每当我尝试使用python浏览器打开保存的html文件时,它会从互联网上加载必要的文件,加载时间太长(非常慢)。

这是原始代码的一部分:

import urllib2, codecs

def download(site):
    response = urllib2.urlopen(site)
    html_input = response.read()
    return html_input

def derealitivise(site, html_input):
    active_html = html_input.replace('<head>', '<head> <base href='+site+'>')
    return active_html

def main(site, output_filename):
    #try:
    site_url = site.encode("utf-8")
    html_input = download(site_url)
    #active_html = derealitivise(site_url, active_html)
    header = "<head> <base href="+site_url+">"
    active_html = html_input.replace('<head>', header)
    #output_file = open (output_filename, "w")
    #output_file = codecs.open(output_filename, "wb", "utf-8-sig")
    #output_file.write(active_html.encode("utf-8"))
    #output_file.close()
    with open(output_filename, 'w') as fid:
        fid.write(active_html)   
    return "OK"

0 个答案:

没有答案