读取多个CSV文件并将其添加到熊猫数据框

时间:2020-04-15 14:33:38

标签: python pandas git csv glob

大家好, 我正在尝试在Dataframe中导入许多csv文件。 我有一个错误:值错误:没有要串联的对象

这是我的代码:

from glob import iglob
import numpy as np
import pandas as pd
# read datas from github repository
path = r'https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_daily_reports'
df1 = pd.concat((pd.read_csv(f) for f in iglob(path+"/*.csv", recursive=True)), ignore_index=True)

感谢您的帮助。如果认为这是由于路径定义引起的?

1 个答案:

答案 0 :(得分:1)

错误表明dfs为空,因此行pd.concat(dfs,...)失败。因此,我猜测.csv文件不在预期的位置。

如果您有奇怪的数据文件夹结构,它应该可以加载,但是由于我看不到您的文件夹结构,因此我很难知道。

尝试这种构造:

path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")

dfs = []
for filename in filenames:
    dfs.append(pd.read_csv(filename))

df1 = pd.concat(dfs, recursive=True)), ignore_index=True)