Python:Pandas:从数据框制作字典

时间:2016-09-05 15:38:49

标签: python pandas dictionary dataframe multiple-columns

我正在尝试将数据框转换为字典:

xtest_cat = xtest_cat.T.to_dict().values()

但它会发出警告:

  

警告:DataFrame列不是唯一的,有些列将被省略python

我检查了数据帧(xtest_cat)的列名:

len(list(xtest_cat.columns.values)) 
len(set(list(xtest_cat.columns.values)))
它们都是独一无二的。 谁能帮我吗 ?

1 个答案:

答案 0 :(得分:3)

您可以使用reset_index创建unique索引:

xtest_cat = pd.DataFrame({'A':[1,2,3],
                          'B':[4,5,6],
                          'C':[7,8,9]})

xtest_cat.index = [0,1,1]
print (xtest_cat)
   A  B  C
0  1  4  7
1  2  5  8
1  3  6  9

print (xtest_cat.index.is_unique)
False

xtest_cat.reset_index(drop=True, inplace=True)
print (xtest_cat)
   A  B  C
0  1  4  7
1  2  5  8
2  3  6  9

xtest_cat = xtest_cat.T.to_dict().values()
print (xtest_cat)
dict_values([{'B': 4, 'C': 7, 'A': 1}, {'B': 5, 'C': 8, 'A': 2}, {'B': 6, 'C': 9, 'A': 3}])

您也可以省略T并添加参数orient='index'

xtest_cat = xtest_cat.to_dict(orient='index').values()
print (xtest_cat)
dict_values([{'B': 4, 'C': 7, 'A': 1}, {'B': 5, 'C': 8, 'A': 2}, {'B': 6, 'C': 9, 'A': 3}])

orient='record'更好:

xtest_cat = xtest_cat.to_dict(orient='records')
print (xtest_cat)
[{'B': 4, 'C': 7, 'A': 1}, {'B': 5, 'C': 8, 'A': 2}, {'B': 6, 'C': 9, 'A': 3}]