无法下载整个html页面

时间:2014-02-20 17:00:03

标签: python web download urllib

由于我的标题可能表明我正在尝试使用脚本显示和下载html页面。 我尝试过不同的python(和ActionScript 3)方法,但它们都没有显示网站上的整个可见内容。

然而,他们都显示了一些javascipt代码(我想下载的网页是由javascript动态创建的)

有什么方法可以捕获可见内容吗?我想要的功能类似于“选择全部 - 复制” - 窗口方法。

1 个答案:

答案 0 :(得分:0)

自您撰写

以来
  

我想要的功能类似于“选择全部 - 复制” - 窗口   方法

我了解您要下载网页的“源代码”。如果这是你想要的,那么这就是你需要做的。

import urllib.request
import re

urls = ["http://google.com","http://yahoo.com"];

i=0;
while i < len(urls):    
    htmlfile = urllib.request.urlopen(urls[i]);
    htmltext = htmlfile.read();
    print(htmltext);
    print("\n");
    i=i+1;

它会读取网址并打印其源代码。