从嵌套dict创建pandas数据帧,外键为df索引和内键列标题

时间:2015-10-15 10:37:41

标签: python dictionary pandas nested dataframe

我有一个嵌套字典,如下所示

dictA = {X:{A: 0.2, B:0.3, C:0.4} ,Y:{A: 0.05, B:0.8, C:0.1},Z:{A: 0.15, B:0.6, C:0.25}}

我想创建一个数据框,其中第一个键对应于索引,嵌套字典的键是列标题。例如,

     A    B    C
  X  0.2  0.3  0.4 
  Y  0.05 0.8  0.1
  Z  0.15 0.6  0.25

我知道我可以从外部字典中将密钥拉出到列表中(使用列表理解):

index_list = [key for key in dictA.iterkeys()]

然后将嵌套的词典放入单个词典中:

dict_list = [value for value in dictA.itervalues()]
final_dict = {k: v for dict in dict_list for k, v in dict.items()}

最后,我可以通过以下方式创建df

df = pd.DataFrame(final_dict, index = index_list)

问题是我需要将正确的值映射回正确的索引,这在普通字典发生变化时很难。

我想有一种完全不同的,比我上面提到的更有效的方法,请帮忙吗?

2 个答案:

答案 0 :(得分:3)

使用from_dict并传递orient='index'它旨在处理这种形式的词典:

In [350]:
pd.DataFrame.from_dict(dictA, orient='index')

Out[350]:
      A     C    B
X  0.20  0.40  0.3
Y  0.05  0.10  0.8
Z  0.15  0.25  0.6

答案 1 :(得分:1)

您可以简单地将dictA转换为数据框,然后进行转置,使列成为索引并将列索引到列中。示例 -

df = pd.DataFrame(dictA).T

演示 -

In [182]: dictA = {'X':{'A': 0.2, 'B':0.3, 'C':0.4} ,'Y':{'A': 0.05, 'B':0.8, 'C':0.1},'Z':{'A': 0.15, 'B':0.6, 'C':0.25}}

In [183]: df = pd.DataFrame(dictA).T

In [184]: df
Out[184]:
      A    B     C
X  0.20  0.3  0.40
Y  0.05  0.8  0.10
Z  0.15  0.6  0.25