我正在使用openpyxl读取和写入xlsx文件,出于某些数据操作的目的,我需要将我的工作表(我在2D矩阵中表示)转换为遵循特定格式的字典,这是我的矩阵
[['Name', 'Age', 'Gender', 'Height', 'Hair Color'],
['Jay', '12', 'M', '123cm', 'Black'],
['Marie', '13', 'F', '100cm', 'Red'],
['Dan', '16', 'M', '200cm', 'Brown']
]
我想翻译这个,以便生成的字典看起来像:
{
{ 'Jay;12;M' : 'Name': 'Jay', 'Age': '12', 'Gender': 'M', 'Height': '123cm', 'Hair Color' : 'Black'},
{ 'Marie;13;F' : 'Name': 'Marie', 'Age': '13', 'Gender': 'F', 'Height': '100cm', 'Hair Color' : 'Red'},
{ 'Dan;16;M' : 'Name': 'Dan', 'Age': '16', 'Gender': 'M', 'Height': '200cm', 'Hair Color' : 'Brown'},
}
我对Python比较陌生,我相信字典理解是要走的路,但我不确定如何通过名称获取这些2D数组值,这样我就可以正确构建我的键值对。
答案 0 :(得分:5)
假设你想要这种格式:
{'<name>;<age>;<gender>': {'Name': <name>, 'Age': <age>, 'Gender': <gender>, 'Height': <height>: 'Hair Color': <hair_color>}}
有:
l
:你的多维数组k
:第一行(键)试试这个:
{reduce(lambda x, y : '{0};{1}'.format(x,y), l[j]):{k[i]: l[j][i] for i in range(len(k))} for j in range(1, len(l))}
此列表理解遍历l
的所有行(第一行除外),并为每一行创建一个字典,其键是k
的元素,值是当前l
行的元素。
<强>更新强>
您可以将另一个iterable传递给reduce
函数而不是l[j]
(完整行)。对于您的情况,可以是:l[j][:3]
而不是l[j]
,请参阅slices的使用。
所以上面应该有:reduce(lambda x, y : '{0};{1}'.format(x,y), l[j][:3])
。
此外,使用zip()可以使内部词典的创建更加优雅:
r = {reduce(lambda x, y : '{0};{1}'.format(x,y), l[j][:3]):{t[0]: t[1] for t in zip(k, l[j])} for j in range(1, len(l))}