通过监听构建触发器自动下载几个嵌套URL中的可执行文件

时间:2014-09-26 00:06:59

标签: python download urllib2

有没有办法点击网页上最新的网址,然后点击其中的网址,以便在python中下载exe文件。

我知道如何从静态网址下载文件但是如何更改网址?

注意:我想从所有网址中找到最新的网址。然后我需要再次点击其中的网址。稍后,下载该文件。

提前致谢!

1 个答案:

答案 0 :(得分:0)

我使用BeautifulSoup按照ZZY的建议完成此任务。谢谢ZZY。基本上,我们可以这样做:

    page = self.authorizedopen(username, password, url)
    text = page.read()
    page.close()
    soup = BeautifulSoup(text)
    data = ''
    for tag in soup.findAll('a', href=True):
        data = tag['href']

    return url + '/' + data

不断操纵网址到达我想要的地方。然后使用简单的urlib2下载所需的文件。