Wget使用文件中的行下载文件并重命名

时间:2015-03-29 11:01:54

标签: python bash wget

我的文件的链接由\n分隔。 我还有一个文件,其中包含每个链接的新名称。 有没有办法下载文件并仅使用wget重命名它们?

我这样做是因为我从链接所在的网页上获取了这些链接 最后是文件名的哈希值,但文件的实际名称存储在html元素的描述中。

1 个答案:

答案 0 :(得分:1)

Python解决方案:

#-*- coding:utf-8 -*-
import os
import urllib2

with open('path_to_your_hash_url', 'r') as fh:
    url_to_be_download = fh.read().split("\n")

with open('path_to_your_FileNames', 'r') as fh:
    fileNames = fh.read().split('\n')

siteurl = 'http://whatever.com/'  #path to your site


downloadFolder = r'YourDownloadFile folder'


for i, url in enumerate(url_to_be_download):
    location = os.path.join(downloadFolder, url_to_be_download[i])
    with open(newloc,"w") as fh:
        full_url = siteurl+ url
        ufile = urllib2.urlopen(full_url).read()
        fh.write(ufile)