使用不同数量的字典保存嵌套字典

时间:2015-04-21 12:12:45

标签: python csv dictionary structured-data

我有一本字典词典,但每个词都有不同数量的词典作为价值。此外,嵌套字典的键可以采用三种不同的形式。

myDict = {
    u'A': {'1998': u'ATLANTA'},
    u'B': {'1999': u'MANNHEIM'},
    u'C': {'2000': u'BERLIN'},
    u'D': {'1998': u'CHICAGO', '1999': u'PRINCETON'},
    u'E': {'2000': u'LOUISIANA'},
    u'F': {'1998': u'NEW YORK', '1999': u'NEW YORK'}
}

我想将myDict写成一个类似

的表格
  | 1998     | 1999     | 2000
A | ATLANTA  |          |
B |          | MANNHEIM |
C |          |          | BERLIN
D |          | CHICAGO  | PRINCETON
E |          |          | LOUISANA
F | NEW YORK | NEW YORK |

我该怎么做?我尝试使用DictWriter中的Writercsv,但两者都不起作用:

DictWriter

import csv

with open("outfilename.csv", 'w') as f:
    fieldnames = ['author', '1998', '1999', '2000']
    csvWriter = csv.DictWriter(f, fieldnames)
    csvWriter.writerows(myDict)

结果:

  File "./011_create_node_lists.py", line 122, in <module>
    csvWriter.writerows(myDict)
  File "/usr/lib/python2.7/csv.py", line 157, in writerows
    rows.append(self._dict_to_list(rowdict))
  File "/usr/lib/python2.7/csv.py", line 149, in _dict_to_list
    return [rowdict.get(key, self.restval) for key in self.fieldnames]
AttributeError: 'unicode' object has no attribute 'get'

writer

import csv

with open("outfilename.csv", 'w') as f:
    csvWriter = csv.writer(f)
    for key, value in myDict.items():
       csvWriter.writerow([key, value])

结果:

A | {'1998': u'ATLANTA'}
B | {'1999': u'MANNHEIM'}
C | {'2000': u'BERLIN'}
D | {'1998': u'CHICAGO'    | '1999': u'PRINCETON'}
E | {'2000': u'LOUISIANA'}
F | {'1998': u'NEW YORK'   | '1999': u'NEW YORK'}

此外,我甚至不确定这是否是打印结构化表格的最佳方式。

2 个答案:

答案 0 :(得分:4)

DictWriter's writerows方法需要字典列表,以便它可以遍历列表以获取每个字典并从中创建CSV行(此由_dict_to_list按照你的追溯完成。如果您传递字典词典,那么当您对其进行迭代时,您会得到每个键,它无法创建一行(它是unicode,不是dict,所以_dict_to_list窒息)。因此,您需要将词典词典处理为词典列表,确保每个词典都有相应的键。

例如:

rows = [dict(author=author, **data) for author, data in myDict.items()]

(如果此语法的任何部分不熟悉,请参阅Python for-in loop preceded by a variableWhat does ** (double star) and * (star) do for parameters?

在您的输入中,这给了我:

[{'1998': u'ATLANTA', 'author': u'A'}, 
 {'2000': u'BERLIN', 'author': u'C'}, 
 {'1999': u'MANNHEIM', 'author': u'B'}, 
 {'2000': u'LOUISIANA', 'author': u'E'}, 
 {'1999': u'PRINCETON', '1998': u'CHICAGO', 'author': u'D'}, 
 {'1999': u'NEW YORK', '1998': u'NEW YORK', 'author': u'F'}]

请注意,排序可能会有所不同,因为词典无序(除非您使用例如[... in sorted(myDict.items())],按author按字母顺序排序。

答案 1 :(得分:3)

csv.DictWriter.writerows获取字典列表,而不是词典字典。您需要在内部字典中添加author密钥。

所以:

csvWriter.writerows(
    dict(data.items() + [('author', author)])
    for author, data in author_aff_dict.items()
)

或者更详细地说:

author_rows = []
for author, data in author_aff_dict.items():
    row = {'author': author}
    row.update(data)
    author_rows.append(row)
csvWriter.writerows(author_rows)

您可能还希望从writeheader()电话

开始