所以我试图从我抓过的网站上下载文件(图像和文档)。我必须将它们下载到特定文件夹。到目前为止,我有:
images = re.findall("/([^/]+\.(?:jpg|gif|png))", html)
output = open("output.txt","a+")
output.write("\n" + f"[+] {len(images)} Images Found:" + "\n")
for images in images:
output.write(images + "\n")
output.write("Beginning file download with urllib2..." + "\n")
imageurl = "images"
urllib.request.urlretrieve(url, "/downloads")
如何保持文件名与具有特定文件类型的网站上的文件名相同?
这只是处理图像的代码的一部分。