我只想问一下如何将多个具有不同列的csv文件组合在一起。并非所有的csv文件都具有相同数量的列和列名。条件是是否要保留所有列。因此,例如,在dataframe1中有A,B和C列。在dataframe2中有B,C和D列,在dataframe 3中有C,D和E列。我希望我的输出包含所有列,并且将为那些不包含其他数据帧的列的数据帧注册Null值。在这种情况下,我还将分钟数据转换为小时数据。
预先感谢
Al Sah-Him
filepath = os.listdir(ndr) 打印(文件路径)
li=[]
for f in filepath:
data=pd.read_csv(f, header=0)
data['collectiondatetime']= pd.to_datetime(data['collectiondatetime'])
groupref=pd.to_datetime(data['collectiondatetime'].dt.strftime('%Y-%m-%d %H'))
frame=data.groupby(groupref).mean()
print(frame)
li.append(frame)
df=pd.concat(li, sort=False)
print(df)