我们怎样才能读取压缩成多个文件的csv文件?
由于FAT存储格式的4 GB限制,我已将csv文件编译为多个zip文件,如test.zip
和test.z01
。
我发现库zipfile
可以读取"单个"中的csv文件。压缩文件。但我不知道在"中单独阅读csv文件"压缩文件。
例如: Reading csv zipped files in python 提供如何在一个压缩文件中读取csv文件。
import pandas as pd
import zipfile
zf = zipfile.ZipFile('C:/Users/Desktop/THEZIPFILE.zip')
df = pd.read_csv(zf.open('intfile.csv'))
总之,我的问题是,我们如何同时阅读test.zip
和test.z01
以及访问csv文件?
答案 0 :(得分:0)
我以迂回的方式解决了这个问题,方法是将两个csv文件显式地放入完全不同的两个压缩文件中,这两个文件具有相似的列数并将它们组合成一个文件。
import pandas as pd
import zipfile
zf1 = zipfile.ZipFile('C:/Users/Desktop/THEZIPFILE1.zip')
df1 = pd.read_csv(zf1.open('intfile.csv'))
zf2 = zipfile.ZipFile('C:/Users/Desktop/THEZIPFILE2.zip')
df2 = pd.read_csv(zf2.open('intfile.csv'))