使用Python 2.7.5将文件夹中的所有压缩文件解压缩到同一文件夹

时间:2015-07-10 17:23:56

标签: python python-2.7 unzip zipfile arcpy

我想编写一个简单的脚本来遍历文件夹中的所有文件,并将压缩文件(.zip)解压缩到同一个文件夹。对于这个项目,我有一个包含近100个压缩.las文件的文件夹,我希望能够轻松地批量解压缩它们。我尝试使用以下脚本

import os, zipfile

folder = 'D:/GISData/LiDAR/SomeFolder'
extension = ".zip"

for item in os.listdir(folder):
    if item.endswith(extension):
        zipfile.ZipFile.extract(item)

但是,当我运行脚本时,出现以下错误:

Traceback (most recent call last):
  File "D:/GISData/Tools/MO_Tools/BatchUnzip.py", line 10, in <module>
    extract = zipfile.ZipFile.extract(item)
TypeError: unbound method extract() must be called with ZipFile instance as first argument (got str instance instead)

我正在使用python 2.7.5解释器。我查看了zipfile模块的文档(https://docs.python.org/2/library/zipfile.html#module-zipfile),我想了解我做错了什么。

我想在我看来,这个过程会是这样的:

  1. 获取文件夹名称
  2. 循环浏览文件夹并查找zip文件
  3. 将zip文件解压缩到文件夹
  4. 感谢Marcus,在实施建议时,我收到了另一个错误:

    Traceback (most recent call last):
      File "D:/GISData/Tools/MO_Tools/BatchUnzip.py", line 12, in <module>
        zipfile.ZipFile(item).extract()
      File "C:\Python27\ArcGIS10.2\lib\zipfile.py", line 752, in __init__
        self.fp = open(file, modeDict[mode])
    IOError: [Errno 2] No such file or directory: 'JeffCity_0752.las.zip'
    

    当我使用print语句时,我可以看到文件在那里。例如:

    for item in os.listdir(folder):
        if item.endswith(extension):
            print os.path.abspath(item)
            filename = os.path.basename(item)
            print filename
    

    的产率:

    D:\GISData\Tools\MO_Tools\JeffCity_0752.las.zip
    JeffCity_0752.las.zip
    D:\GISData\Tools\MO_Tools\JeffCity_0753.las.zip
    JeffCity_0753.las.zip
    

    据我了解文档,

    zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])
    
      

    打开一个ZIP文件,其中file可以是文件路径(字符串)或类文件对象

    在我看来,一切都存在并被解释。我只是不明白我做错了什么。

    有什么建议吗?

    谢谢

4 个答案:

答案 0 :(得分:17)

以下代码对我有用:

import os, zipfile

dir_name = 'C:\\SomeDirectory'
extension = ".zip"

os.chdir(dir_name) # change directory from working dir to dir with files

for item in os.listdir(dir_name): # loop through items in dir
    if item.endswith(extension): # check for ".zip" extension
        file_name = os.path.abspath(item) # get full path of files
        zip_ref = zipfile.ZipFile(file_name) # create zipfile object
        zip_ref.extractall(dir_name) # extract file to dir
        zip_ref.close() # close file
        os.remove(file_name) # delete zipped file

回顾我修改的代码,目录与脚本目录混淆。

以下也可以在不破坏工作目录的情况下工作。首先删除行

os.chdir(dir_name) # change directory from working dir to dir with files

然后将file_name指定为

file_name = dir_name + "/" + item

答案 1 :(得分:4)

你需要用文件名构造一个ZipFile对象,然后提取它:

    zipfile.ZipFile.extract(item)

错了。

    zipfile.ZipFile(item).extractall()

将从zip文件中提取所有文件,其名称包含在item中。

我认为您应该更仔细地阅读zipfile :)的文档,但是您已经走上正轨!

答案 2 :(得分:2)

接受的答案很有效!

只是为了扩展想法,在目录中的所有子目录中解压缩扩展名为.zip的所有文件,以下代码似乎运行良好:

import os
import zipfile

for path, dir_list, file_list in os.walk(dir_path):
    for file_name in file_list:
        if file_name.endswith(".zip"):
            abs_file_path = os.path.join(path, file_name)

            # The following three lines of code are only useful if 
            # a. the zip file is to unzipped in it's parent folder and 
            # b. inside the folder of the same name as the file

            parent_path = os.path.split(abs_file_path)[0]
            output_folder_name = os.path.splitext(abs_file_path)[0]
            output_path = os.path.join(parent_path, output_folder_name)

            zip_obj = zipfile.ZipFile(abs_file_path, 'r')
            zip_obj.extractall(output_path)
            zip_obj.close()

答案 3 :(得分:1)

我认为这比较短,对我来说效果很好。首先导入所需的模块:

import zipfile, os

然后,我定义工作目录:

working_directory = 'my_directory'
os.chdir(working_directory)

之后,您可以结合使用oszipfile到达所需位置:

for file in os.listdir(working_directory):   # get the list of files
    if zipfile.is_zipfile(file): # if it is a zipfile, extract it
        with zipfile.ZipFile(file) as item: # treat the file as a zip
           item.extractall()  # extract it in the working directory