我试图在Python中创建嵌套字典的数据结构。我将2个类似sql-table的关系csv文件读入数据帧,然后逐行将它们转换为字典。在这些词典中,我存储了我从另一个csv创建的词典。
只要我将字典直接存储在dict键中,我的代码就可以正常工作。
但我真正想要的是data[id]['ticket']
包含一个词典列表。 (1个顾客可以有多张票)
import json
import pandas as pd
import collections
# Import csv into dataframe (maybe not necessesary)
df1 = pd.read_csv('customer.csv', sep=';', header=0, dtype=object, na_filter=False)
df2 = pd.read_csv('tickets.csv', sep=';', header=0, dtype=object, na_filter=False)
df1['tickets'] = '' #create new empty column in dataframe 1
data = collections.defaultdict(dict)
# Convert initial dataframe to dictionary of dictionarys
for index, row in df1.iterrows():
row_dict = row.to_dict()
data[row_dict['id']] = row_dict
data[row_dict['id']]['tickets'] = []
# Convert each row of dataframe 2 to into dictionary and store on correct key of dict 1
for index, row in df2.iterrows():
row_dict = row.to_dict()
data[row_dict['kundenid']]['tickets'].append(row_dict)
with open('json_file', 'w') as f:
json.dump(data, f, indent=4)
使用此代码,我得到tickets
的关键错误。但是,当我使用data[row_dict['id']]['tickets'] = row_dict
将dict附加到密钥tickets
时,代码可以正常工作。我只需要在这个领域有多个dicts。
我最终想要实现的是一个字典/ JSON,如下所示:
{ "1111": {
"id": "1111",
"name": "",
"adr": "",
"tickets": [{
"ticketid": "123545",
"id": "1111"
},
{
"ticketid": "123545",
"id": "1111"
}]}
....
}
如何在键tickets
下存储词典列表?
编辑:一些示例输入数据:
tickets.csv
id;ticketid;xyz;message
1;9;1;fgsgfs
2;8;2;gdfg
3;7;3;gfsfgfg
4;6;4;fgsfdgfd
5;5;5;dgsgd
6;4;6;dfgsgdf
7;3;7;dfgdhfd
Customer.csv
id;name;surname;address;XID
1;Mueller;Hans;42553;1
2;Meier;Peter;42873;2
3;Schmidt;Micha;42567;213
4;Pauli;Ulli;98790;432
5;Dick;Franz;45632;423
6;Doof;Udo;76543;233
7;Pang;Lars;43232;234
8;Peutz;Lee;11342;4234
答案 0 :(得分:5)
您的解决方案似乎适用于提供的输入数据(见下文)。有什么我想念的吗?
正如您所指出的,您需要在第二个循环中测试密钥,如下所示。这只在您的完整数据集中显而易见。
<强>设置强>
我稍微修改了您的数据,因此可以更好地展示问题。
from collections import defaultdict
import pandas as pd
from io import StringIO
df1 = pd.read_csv(StringIO("""id;name;surname;address;XID
1;Mueller;Hans;42553;1
2;Meier;Peter;42873;2
3;Schmidt;Micha;42567;213"""), sep=';')
df2 = pd.read_csv(StringIO("""id;ticketid;xyz;message
1;9;1;fgsgfs
1;8;2;gdfg
2;7;3;gfsfgfg
2;6;4;fgsfdgfd
3;5;5;dgsgd
3;4;6;dfgsgdf
3;3;7;dfgdhfd"""), sep=';')
<强>解决方案强>
data = defaultdict(dict)
for index, row in df1.iterrows():
row_dict = row.to_dict()
data[row_dict['id']] = row_dict
data[row_dict['id']]['tickets'] = []
for index, row in df2.iterrows():
row_dict = row.to_dict()
if row_dict['id'] in data:
data[row_dict['id']]['tickets'].append(row_dict)
<强>结果强>
defaultdict(dict,
{1: {'XID': 1,
'address': 42553,
'id': 1,
'name': 'Mueller',
'surname': 'Hans',
'tickets': [{'id': 1, 'message': 'fgsgfs', 'ticketid': 9, 'xyz': 1},
{'id': 1, 'message': 'gdfg', 'ticketid': 8, 'xyz': 2}]},
2: {'XID': 2,
'address': 42873,
'id': 2,
'name': 'Meier',
'surname': 'Peter',
'tickets': [{'id': 2, 'message': 'gfsfgfg', 'ticketid': 7, 'xyz': 3},
{'id': 2, 'message': 'fgsfdgfd', 'ticketid': 6, 'xyz': 4}]},
3: {'XID': 213,
'address': 42567,
'id': 3,
'name': 'Schmidt',
'surname': 'Micha',
'tickets': [{'id': 3, 'message': 'dgsgd', 'ticketid': 5, 'xyz': 5},
{'id': 3, 'message': 'dfgsgdf', 'ticketid': 4, 'xyz': 6},
{'id': 3, 'message': 'dfgdhfd', 'ticketid': 3, 'xyz': 7}]}})