我有4个嵌套列表,其结构如下:
liste 1 = [[ColA,ColB,ColC],.....]
liste 2 = [[ColA,ColB,ColD],.....]
liste 3 = [[ColA,ColB,ColE],.....]
liste 4 = [[ColA,ColB,ColF],.....]
共有2列。我想创建一个具有以下结构的数据框:
df.columns = [ColA,ColB,ColC,ColD,ColE,ColF]
我到目前为止所做的:
df1 =pd.DataFrame(list1,columns=['ColA','ColB','ColC'])
df2 = pd.DataFrame(list2,columns=['ColA','ColB','ColD'])
df3 = pd.DataFrame(list3,columns=['ColA','ColB','ColE'])
df4 = pd.DataFrame(list4,columns=['ColA','ColB','ColF'])
print('merging dataframes')
#dirty line to execute several outer join on multiple df in one line
df_Total=df1.merge(df2,how='left',on=['ColA','ColB']).merge(df3,how='left',on=['ColA','ColB']).merge(df4,how='left',on=['ColA','ColB'])
我想知道是否有更好的方法来执行此操作以提高性能。 我还尝试了合并数据帧的join方法。我认为主要的改进是直接从列表中创建正确的df,而无需创建4,然后将它们合并在一起。