合并具有不同字段和未知字段的数据框

时间:2018-10-09 11:02:01

标签: python pandas

作为一个玩具示例,我通过抓取网站获得了以下熊猫数据框

[       num :                  2
0       ma1 :                  1
1       ma2 :                0.2
2       ma3 :                  5
3       ma4 :                1.8]

[       num :                  2
0       ma1 :                  1
1       ma2 :                0.2
2       ma3 :                  5
3       ma4 :                1.8
4       ma5 :                  7]

我想将它们合并到一个数据库中,而无需事先了解所有字段名称。为此,我相信我需要将它们转换为类似于下面的内容,以便我可以附加它们。

[       num :    ma1:    ma2:    ma3:   ma4:
0           2       1     0.2      5     1.8]   

[       num :    ma1:    ma2:    ma3:   ma4:    ma5:
0           2       1     0.2      5     1.8       7]   

这是一个明智的方法,我怎么能实现呢?

1 个答案:

答案 0 :(得分:2)

我认为您需要使用set_index进行列表解析,并使用T进行转置:

dfs = [x.set_index(x.columns[0]).T for x in dfs]

如果需要将它们加入一起,请添加concat

df = pd.concat([x.set_index(x.columns[0]) for x in dfs], axis=1).T