我有一本字典,格式为:
{"k": {"k1": [[v1]],"k2": [[v2]],"k3": [[v3]]}
如何将其转换为以下格式的两个数组:
[kk1,kk2,kk3]
[v1,v2,v3]
我在Python中有一个函数,但是无法获得所需格式的结果。
def dict_to_list_of_keys(d, l, loc):
for k in iter(d):
loc.append(k)
l.append(loc * 1)
if isinstance(d[k], dict):
dict_2_list_of_keys(d[k], l, loc)
loc.pop()
return l
答案 0 :(得分:1)
我会为此使用熊猫。首先从字典创建一个数据框。
import pandas as pd
import numpy as np
dict_test = {"k": {"k1": [['v1']],"k2": [['v2']],"k3": [['v3']]}}
df = pd.DataFrame.from_dict(dict_test)
Pandas巧妙地将键值作为索引,并将实际列表值作为数据。现在,您可以对数据框架进行子集化,以任意方式提取数据。一种建议是从索引中创建一个新列,如下所示:
df['key_value'] = df.index
现在,您可以像其他任何列一样引用键值。如果您有更复杂的字典,大熊猫会为每个键/值对创建一列,这意味着您可能必须将数据框融合为更有用的形状。
最后,如果您随后想要转换为沿行某处的numpy数组,由于每个单独的列表都是数据框中的一个单元格,您应该使用诸如apply(假设df现在只是列表的单列)之类的东西>
df.apply(lambda x: np.array(x))
您将为数据框中的每一行返回一个numpy数组。希望这会有所帮助。
答案 1 :(得分:1)
通过for
使用list.append
循环。将列表转换为数组很简单,即np.array(L)
。
d = {"k": {"k1": [['v1']],"k2": [['v2']],"k3": [['v3']]}}
keys, values = [], []
for k1, v1 in d.items():
for k2, v2 in v1.items():
keys.append(k1+k2)
values.append(v2[0][0])
print(keys, values, sep='\n')
['kk1', 'kk2', 'kk3']
['v1', 'v2', 'v3']
答案 2 :(得分:0)
这是一种方式:
import numpy as np
d = {"k": {"k1": [['v1']],"k2": [['v2']],"k3": [['v3']]}}
lst = []
for k, v in d.items():
for k1, v1 in v.items():
lst.extend([(k+k1, v1[0][0])])
print(np.array(list(zip(*lst))))
# [['kk1' 'kk2' 'kk3']
# ['v1' 'v2' 'v3']]