python - 从7z中提取csv文件

时间:2015-04-23 14:51:54

标签: python csv 7zip lzma

我有很多不同的7z文件中包含的csv文件。我想在这些7z文件中找到特定的csv文件,并将它们解压缩到另一个目录中。 我试过了

import os
import py7zlib

tree = r'Where_the_7zfiles_are_stored'
dst = r'Where_I_want_to_store_the_csvfiles'

for dirpath, dirname, filename in os.walk(tree):
    for myfile in filename:
        if myfile.endswith('2008-01-01_2008-04-30_1.7z'):
            myZip = py7zlib.Archive7z(open(os.path.join(dirpath,myfile), 'rb'))
            csvInZipFile = zip(myZip.filenames,myZip.files)
            for myCsvFileName, myCsvFile in csvInZipFile:
                if '2008-01' in myCsvFileName:
                    with open(os.path.join(dst,myCsvFileName),'wb') as outfile:
                        outfile.write(myCsvFile.read())

但是我收到以下错误

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Users\'\Anaconda3\lib\site-packages\spyderlib\widgets\externalshell\sitecustomize.py", line 682, in runfile
execfile(filename, namespace)
  File "C:\Users\'\Anaconda3\lib\site-packages\spyderlib\widgets\externalshell\sitecustomize.py", line 85, in execfile
    exec(compile(open(filename, 'rb').read(), filename, 'exec'), namespace)
  File "C:/Users//'/Documents/Example/unzipfiles.py", line 23, in <module>
outfile.write(myCsvFile.read())
  File "C:\Users\'\Anaconda3\lib\site-packages\py7zlib.py", line 576, in read
    data = getattr(self, decoder)(coder, data)
  File "C:\Users\'\Anaconda3\lib\site-packages\py7zlib.py", line 634, in _read_lzma
return self._read_from_decompressor(coder, dec, input, checkremaining=True, with_cache=True)
  File "C:\Users\'\Anaconda3\lib\site-packages\py7zlib.py", line 611, in _read_from_decompressor
    tmp = decompressor.decompress(data)
ValueError: data error during decompression

奇怪的是,该方法似乎适用于前两个csv文件。我不知道如何找到问题的根源。至少csv文件中的数据似乎并不相同。使用IZArc手动解压缩不同的csv文件没有问题。 (问题出现在python 2.7和3.4中)。

我也尝试使用lzma模块,但在这里我无法弄清楚如何检索7z文件中包含的不同csv文件。

0 个答案:

没有答案