urllib2下载损坏的.jpg文件

时间:2018-03-31 11:08:03

标签: python python-2.7 urllib2

我有一个Python程序,我需要从互联网上下载.jpg文件。我有一个while True:循环遍历我拥有的URL并从每个URL下载文件。每隔20个左右的文件,urllib2下载一个半灰色的文件,FPDF拒绝通过损坏的文件从下载的文件中生成PDF。 这是我的代码:

filename = ''.join(pageForFilename)
add_image_to_list()
file_ = open(filename, 'w')
file_.write(data)
file_.close()

time.sleep(0.5)

注意pageForFilename是page-001.jpg可能很有用 我想也许我不允许脚本完全下载文件,所以我添加了time.sleep(0.5),认为它会修复它。 python 2.7 MacOS Sierra

1 个答案:

答案 0 :(得分:4)

问题出在(如果你在Windows中):

file_ = open(filename, 'w')

您正在将文件写为文本。

尝试:

file_ = open(filename, 'wb')

您是否将文件强制为二进制文件。