如何按行压缩两个元组列表?

时间:2019-01-22 14:18:03

标签: python python-3.x pandas list dataframe

我有两个这样的列表:

list1 = [{'id':'1','id2':'2'},{'id':'2','id2':'3'}]
list2 = [{'fname':'a','lname':'b'},{'fname':'c','lname':'d'}]

如何将列表组合成一组用于熊猫数据框的元组?

像这样:

final_list = [{'id':'1','id2':'2','fname':'a','lname':'b'},{'id':'2','id2':'3','fname':'c','lname':'d'}]

数据框应如下所示:

id     id2      fname     lname
1       2         a          b
2       3         c          d 

到目前为止已经尝试过:

final_list = list(zip(list1,list2))

df = pd.DataFrame(final_list)

df:

0                          1
[{nested_data}]          [{nested_data}]

3 个答案:

答案 0 :(得分:5)

您应该执行pd.concat

根据文档,似乎@jpp回答在性能方面更好。我更倾向于相信一个基准,但是老实说,我相信pandas documentation

import pandas as pd

df = pd.DataFrame(list1)
df2 = pd.DataFrame(list2)

result_df = pd.concat([df, df2], axis=1)

#result_df
#  id id2 fname lname
#0  1   2     a     b
#1  2   3     c     d

答案 1 :(得分:5)

“纯” Python答案(即没有熊猫):

[{**x[0], **x[1]} for x in zip(list1, list2)]

> [{'id': '1', 'id2': '2', 'fname': 'a', 'lname': 'b'},
    {'id': '2', 'id2': '3', 'fname': 'c', 'lname': 'd'}]

由Scott Boston编辑

pd.DataFrame([{**x[0], **x[1]} for x in zip(list1, list2)])

输出:

  fname id id2 lname
0     a  1   2     b
1     c  2   3     d

答案 2 :(得分:4)

您可以只使用pd.DataFrame.join

df = pd.DataFrame(list1).join(pd.DataFrame(list2))

print(df)

  id id2 fname lname
0  1   2     a     b
1  2   3     c     d