几篇文章介绍了如何循环浏览文件夹,或从给定的zip提取所有(或:特定的)文件,或从文件中的多个CSV创建熊猫数据框。 las,我缺乏将所有这些代码段组合成有效的内容的经验-有人可以帮我吗?
我目前拥有的东西:
import gzip
import csv
import json
import pandas as pd
path =r'C:\\Users\\folder_with_zipped_files'
File_List= glob.glob(path + "/*.csv.gz")
frame = pd.DataFrame()
list_ = []
for file_ in File_List:
df = pd.read_csv(File_List, compression='gzip', header=0,sep=',', error_bad_lines=False)
collectfiles.append(df)
allfiles = pd.concat(collectfiles)
这会引发错误:
ValueError: Invalid file path or buffer object type: <class 'list'>
感谢您提供一百万的建议和帮助-非常感谢!