Python:从多个csv.gz创建熊猫数据帧,仅提取von CSV指定列

时间:2018-06-25 15:30:10

标签: python pandas dataframe

几篇文章介绍了如何循环浏览文件夹,或从给定的zip提取所有(或:特定的)文件,或从文件中的多个CSV创建熊猫数据框。 las,我缺乏将所有这些代码段组合成有效的内容的经验-有人可以帮我吗?

我目前拥有的东西:

import gzip
import csv
import json
import pandas as pd

path =r'C:\\Users\\folder_with_zipped_files' 
File_List= glob.glob(path + "/*.csv.gz")
frame = pd.DataFrame()
list_ = []
for file_ in File_List:
    df = pd.read_csv(File_List, compression='gzip', header=0,sep=',',  error_bad_lines=False)
    collectfiles.append(df)
allfiles = pd.concat(collectfiles)

这会引发错误:

ValueError: Invalid file path or buffer object type: <class 'list'>

感谢您提供一百万的建议和帮助-非常感谢!

0 个答案:

没有答案