Question

我只想问一下如何将多个具有不同列的csv文件组合在一起。并非所有的csv文件都具有相同数量的列和列名。条件是是否要保留所有列。因此，例如，在dataframe1中有A，B和C列。在dataframe2中有B，C和D列，在dataframe 3中有C，D和E列。我希望我的输出包含所有列，并且将为那些不包含其他数据帧的列的数据帧注册Null值。在这种情况下，我还将分钟数据转换为小时数据。

预先感谢

Al Sah-Him

enter image description here

filepath = os.listdir（ndr）打印（文件路径）

li=[]


for f in filepath:
    data=pd.read_csv(f, header=0)
    data['collectiondatetime']= pd.to_datetime(data['collectiondatetime'])
    groupref=pd.to_datetime(data['collectiondatetime'].dt.strftime('%Y-%m-%d %H'))
    frame=data.groupby(groupref).mean()
    print(frame)
    li.append(frame)

df=pd.concat(li, sort=False)
print(df)

读取并合并具有不同列的多个csv文件

0 个答案: