我有两个这样的列表:
list1 = [{'id':'1','id2':'2'},{'id':'2','id2':'3'}]
list2 = [{'fname':'a','lname':'b'},{'fname':'c','lname':'d'}]
如何将列表组合成一组用于熊猫数据框的元组?
像这样:
final_list = [{'id':'1','id2':'2','fname':'a','lname':'b'},{'id':'2','id2':'3','fname':'c','lname':'d'}]
数据框应如下所示:
id id2 fname lname
1 2 a b
2 3 c d
到目前为止已经尝试过:
final_list = list(zip(list1,list2))
df = pd.DataFrame(final_list)
df:
0 1
[{nested_data}] [{nested_data}]
答案 0 :(得分:5)
您应该执行pd.concat。
根据文档,似乎@jpp回答在性能方面更好。我更倾向于相信一个基准,但是老实说,我相信pandas documentation。
import pandas as pd
df = pd.DataFrame(list1)
df2 = pd.DataFrame(list2)
result_df = pd.concat([df, df2], axis=1)
#result_df
# id id2 fname lname
#0 1 2 a b
#1 2 3 c d
答案 1 :(得分:5)
“纯” Python答案(即没有熊猫):
[{**x[0], **x[1]} for x in zip(list1, list2)]
> [{'id': '1', 'id2': '2', 'fname': 'a', 'lname': 'b'},
{'id': '2', 'id2': '3', 'fname': 'c', 'lname': 'd'}]
由Scott Boston编辑
pd.DataFrame([{**x[0], **x[1]} for x in zip(list1, list2)])
输出:
fname id id2 lname
0 a 1 2 b
1 c 2 3 d
答案 2 :(得分:4)
您可以只使用pd.DataFrame.join
:
df = pd.DataFrame(list1).join(pd.DataFrame(list2))
print(df)
id id2 fname lname
0 1 2 a b
1 2 3 c d