我是Python的新手并尝试了我能想到的所有事情,但无法找到解决方案。 我有一个列表,其中包含一个字典,具有不同数量的键,作为其最后一项,看起来像。
l = [('Apple', 1, 2, {'gala': (2, 1.0)}),
('Grape ', 2, 4, {'malbec': (4, 0.25), 'merlot': (4, 0.75)}),
('Pear', 4, 5, {'anjou': (5, 0.2), 'bartlet': (5, 0.4), 'seckel': (5, 0.2)}),
('Berry', 5, 5, {'blueberry': (5, 0.2), 'blackberry': (5, 0.2), 'straw': (5, 0.2)})]
当我尝试从当前列表中编写.csv文件时,我使用了:
test_file = ()
length = len(l[0])
with open('test1.csv', 'w', encoding = 'utf-8') as test_file:
csv_writer = csv.writer(test_file, delimiter=',')
for y in range(length):
csv_writer.writerow([x[y] for x in l])
它使列表中的最后一个元素(字典)只是输出文件中的一个字符串:
Apple 1 2 {'gala': (2, 1.0)}
Grape 2 4 {'malbec': (4, 0.25), 'merlot': (4, 0.75)}
Pear 4 5 {'anjou': (5, 0.2), 'bartlet': (5, 0.4), 'seckel': (5, 0.2), 'bosc': (5, 0.2)}
Berry 5 5 {'blueberry': (5, 0.2), 'blackberry': (5, 0.2), 'straw': (5, 0.2)}
使用最后一项内的值进行任何操作都无法实现。
我试图压缩嵌套字典,所以我只得到一个简单的列表,但结果并没有保留项目之间的关系。我需要的是拆分字典并输出看起来像这样:
Apple 1 2 gala 2 1.0
Grape 2 4 malbec 4 0.25
merlot 4 0.75
Pear 4 5 anjou 5 0.2
bartlet 5 0.4
seckel 5 0.2
bosc 5 0.2
Berry 5 5 blueberry 5 0.2
blackberry 5 0.2
straw 5 0.2
我的意思有点像这样,因为我没有承诺这种格式,而是认为字典的层次关系不会在输出文件中丢失。有办法吗?我是python的新手,感谢任何帮助。谢谢!
答案 0 :(得分:1)
假设您必须将其存储在CSV中,并且dict中每个项目有一行,下面将显示如何编写和读取它。如果您拥有大量数据,这不是最有效的,也不是最佳的,因为它会重复每行中的数据,但它会很好地压缩。
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""csv_dict.py
"""
import csv
import pprint
from collections import namedtuple
Row = namedtuple('Row', [
'name',
'value_1',
'value_2',
'extra_name',
'extra_value_1',
'extra_value_2'
])
l = [
('Apple', 1, 2, {'gala': (2, 1.0)}),
('Grape ', 2, 4, {'malbec': (4, 0.25), 'merlot': (4, 0.75)}),
('Pear', 4, 5, {
'anjou': (5, 0.2),
'bartlet': (5, 0.4),
'seckel': (5, 0.2)}
),
('Berry', 5, 5, {
'blueberry': (5, 0.2),
'blackberry': (5, 0.2),
'straw': (5, 0.2)
})
]
print('List before writing: ')
pprint.pprint(l)
# Writing the data.
with open('test1.csv', 'wb') as fout:
writer = csv.writer(fout)
for row in l:
for k, v in row[3].iteritems():
writer.writerow(row[0:3] + (k,) + v)
# Reading the data.
format_extra = lambda row: (int(row.extra_value_1), float(row.extra_value_2))
with open('test1.csv', 'rU') as fin:
reader = csv.reader(fin)
ll = []
hl = {}
for row in (Row(*r) for r in reader):
if row.name in hl:
ll[hl[row.name]][3][row.extra_name] = format_extra(row)
continue
ll.append(row[0:3] + ({
row.extra_name: format_extra(row)
},))
hl[row.name] = len(ll) - 1
pprint.pprint(ll)
答案 1 :(得分:0)
好像你很亲密。几点 - 您不需要初始化test_file
,并且可以将length
放在迭代器中。
如果我将此写入csv,我可能会使用
with open('test1.csv', 'w', encoding = 'utf-8') as test_file:
for row in l:
species_data = row[:3]
for subspecies, subspecies_data in row[4].iter_items():
write_row = species_data + [subspecies] + list(subspecies_data)
test_file.write(','.join([str(j) for j in write_row]))
当然,如果它是一个大清单,或者你非常担心重复信息,你可以进行优化。
答案 2 :(得分:0)
这是一个快速功能,我修改为采用列表,元组或字典并将其展平。它将展平所有嵌套部件。
我修改了你的代码并在python 2.7中测试过。这应该生成您正在寻找的输出:
def flatten(l):
'''
flattens a list, dict or tuple
'''
ret = []
for i in l:
if isinstance(i, list) or isinstance(i, tuple):
ret.extend(flatten(i))
elif isinstance(i, dict):
ret.extend(flatten(i.items()))
else:
ret.append(i)
return ret
l = [('Apple', 1, 2, {'gala': (2, 1.0)}),
('Grape ', 2, 4, {'malbec': (4, 0.25), 'merlot': (4, 0.75)}),
('Pear', 4, 5, {'anjou': (5, 0.2), 'bartlet': (5, 0.4), 'seckel': (5, 0.2)}),
('Berry', 5, 5, {'blueberry': (5, 0.2), 'blackberry': (5, 0.2), 'straw': (5, 0.2)})]
test_file = ()
length = len(l[0])
with open('test1.csv', 'wb') as test_file:
csv_writer = csv.writer(test_file, delimiter=',')
for y in range(length):
line = flatten(l[y])
csv_writer.writerow([x for x in line])
答案 3 :(得分:0)
如果你坚持使用CSV / TSV,你应该记住它是表的表示,但你希望它看起来像一个结构化文件(XML / JSON / YAML)。我建议使用CSV / TSV将数据存储为关系表,否则你可能会遇到一些混乱的输出。在您的情况下,选择的选项将输出如下:
标题
SuperSpecieName,SpecieName,Value1,Value2
数据:
"",Apple,1,2
Apple,gala,2,1.0
"",Grape,2,4
Grape,malbec,4,0.25
Grape,merlot,4,0.75
...