Python:编写脚本以从HTTPS URL数据库中删除图像

时间:2017-03-16 11:30:16

标签: python python-3.x web-scraping

我昨天在python 3.x中搞砸了,我想从HTTPS网站上删除所有图片。这是我到目前为止的代码

import urllib
import urllib.request

idnum = 190154

ur = 'https://skystorage.iscorp.com/pictures/IL/Lincolnway//%d' % idnum
url = ur + '.JPG?rev=0'
filename = str(idnum) + '.JPG'

idnum = idnum + 1

try: urllib.request.urlretrieve(url , filename)
except urllib.error.URLError as e:
        print(e.reason) 

然而,这根本没有按计划运行,因为URL是HTTPS,而urllib似乎不支持这一点。我怎么能做类似刮刮图像的事情呢?

1 个答案:

答案 0 :(得分:0)

男人有很多工作要做,但无论如何我想帮助你。 首先想你应该知道的是,如果你在一个html页面中,首先你必须创建一个你想要下载的图像网址列表,为此你可以找到有用的知道什么是正则表达式并知道如何使用python的RE库。 使用RE,您可以在html代码中搜索图像的网址。 然后创建一个方法,在您的计算机上保存之前创建的列表中的所有图像。 我希望我有所帮助