Question

由于我的标题可能表明我正在尝试使用脚本显示和下载html页面。我尝试过不同的python（和ActionScript 3）方法，但它们都没有显示网站上的整个可见内容。

然而，他们都显示了一些javascipt代码（我想下载的网页是由javascript动态创建的）

有什么方法可以捕获可见内容吗？我想要的功能类似于“选择全部 - 复制” - 窗口方法。

Answer 1

自您撰写

以来

我想要的功能类似于“选择全部 - 复制” - 窗口方法

我了解您要下载网页的“源代码”。如果这是你想要的，那么这就是你需要做的。

import urllib.request
import re

urls = ["http://google.com","http://yahoo.com"];

i=0;
while i < len(urls):    
    htmlfile = urllib.request.urlopen(urls[i]);
    htmltext = htmlfile.read();
    print(htmltext);
    print("\n");
    i=i+1;

它会读取网址并打印其源代码。

无法下载整个html页面

1 个答案: