在Python中,如何在保留文件夹结构的同时提取zip存档,但从提取中排除某些文件名(文件类型)?例如,我想要排除所有.tif
图像。
我使用的是Python 3.x和zipfile
模块。
答案 0 :(得分:1)
将已过滤的members
传递给extractall()
。 archive.extractall(members=(member for member in archive.namelist() if not member.endswith('.tif')))
。
def extractall(self, path=None, members=None, pwd=None):
"""Extract all members from the archive to the current working
directory. `path' specifies a different directory to extract to.
`members' is optional and must be a subset of the list returned
by namelist().
"""
if members is None:
members = self.namelist()
for zipinfo in members:
self.extract(zipinfo, path, pwd)
答案 1 :(得分:1)
自从我使用这个例程已经有一段时间了,所以我不得不把它挖出来。 您可能希望测试/适应您的特定需求。
排除if
语句仅检查要提取的文件名的最后三个字符,您可以使用.split('.')
更改此选项以检查完整扩展名,因为现在有多个文件超过3个扩展名字符。
这是为Windows编写的,如果在其他操作系统上运行,您可能想要更改某些位
此代码保留了文件夹结构,但可能不是最快的例程(尽管我从来没有抱怨过:
import zipfile
def unzip_file(zippedfile = '', targetdir = '', exclude_ext = ''):
if zippedfile == '': ## this is the .zip file
return
if targetdir == '':
targetdir = os.path.join(os.path.dirname(zippedfile), os.path.basename(zippedfile)[:-4])
if not os.path.exists (targetdir):
os.makedirs (targetdir)
zfile = zipfile.ZipFile(zippedfile)
for name in zfile.namelist():
(dirName, fileName) = os.path.split(name)
if not dirName == '':
if not os.path.exists (os.path.join(targetdir, dirName)):
os.makedirs (os.path.join(targetdir, dirName))
if fileName == '':
# directory
newDir = os.path.join(targetdir, dirName)
if not os.path.exists(newDir):
os.makedirs (newDir)
else:
# file
if exclude_ext == '':
print ('Extracting File : ' + name)
fd = open(os.path.join(targetdir, name), 'wb')
fd.write(zfile.read(name))
fd.close()
else:
if not exclude_ext == name[-3:]:
print ('Extracting File : ' + name)
fd = open(os.path.join(targetdir, name), 'wb')
fd.write(zfile.read(name))
fd.close()
else:
print ('File with extension ' + exclude_ext + ' is excluded')
zfile.close()
return
祝你好运。