我正在尝试使用Python的zipfile
模块编写一个zip文件,该模块从某个子文件夹开始,但仍保留该子文件夹中的树结构。例如,如果我通过" C:\ Users \ User1 \ OneDrive \ Documents&#34 ;,那么zip文件将包含Documents以后的所有内容,以及所有文档'子文件夹在文档中维护。我有以下代码:
import zipfile
import os
import datetime
def backup(src, dest):
"""Backup files from src to dest."""
base = os.path.basename(src)
now = datetime.datetime.now()
newFile = f'{base}_{now.month}-{now.day}-{now.year}.zip'
# Set the current working directory.
os.chdir(dest)
if os.path.exists(newFile):
os.unlink(newFile)
newFile = f'{base}_{now.month}-{now.day}-{now.year}_OVERWRITE.zip'
# Write the zipfile and walk the source directory tree.
with zipfile.ZipFile(newFile, 'w') as zip:
for folder, _ , files in os.walk(src):
print(f'Working in folder {os.path.basename(folder)}')
for file in files:
zip.write(os.path.join(folder, file),
arcname=os.path.join(
folder[len(os.path.dirname(folder)) + 1:], file),
compress_type=zipfile.ZIP_DEFLATED)
print(f'\n---------- Backup of {base} to {dest} successful! ----------\n')
我知道我必须使用zipfile.write()的arcname
参数,但我无法弄清楚如何维护原始目录的树结构。现在的代码将每个子文件夹写入zip文件的第一级,如果这有意义的话。我已经阅读了几篇帖子,建议我使用os.path.relname()来删除root,但我似乎无法弄清楚如何正确地完成它。我也知道这篇文章与Stack Overflow上的其他文章类似。我已阅读其他帖子,无法弄清楚如何解决这个问题。请告诉我!
答案 0 :(得分:1)
arcname参数将为您要添加的文件设置zip文件中的确切路径。您发出的问题是,当您构建arcname的路径时,您使用了错误的值来获取要删除的前缀的长度。具体做法是:
arcname=os.path.join(folder[len(os.path.dirname(folder)) + 1:], file)
应改为:
arcname=os.path.join(folder[len(src):], file)