有谁知道哪里有序列化数据的配方并保留其在输出中的顺序?

时间:2008-11-25 20:17:53

标签: python serialization

我正在使用一组已转换为词典列表的数据

例如,我的列表中的一个项目是

{'reportDate': u'R20070501', 'idnum': u'1078099', 'columnLabel': u'2005',
 'actionDate': u'C20070627', 'data': u'76,000', 'rowLabel': u'Sales of Bananas'}

按要求

我列表中的第二项可能是:

 {'reportDate': u'R20070501', 'idnum': u'1078099', 'columnLabel': u'2006',
 'actionDate': u'C20070627', 'data': u'86,000', 'rowLabel': u'Sales of Bananas'}

第三项可能是:

 {'reportDate': u'R20070501', 'idnum': u'1078100', 'columnLabel': u'Full Year 2005',
 'actionDate': u'C20070627', 'data': u'116,000', 'rowLabel': u'Sales of Cherries'}

第四项可能是:

 {'reportDate': u'R20070501', 'idnum': u'1078100', 'columnLabel': u'Full Year 2006',
 'actionDate': u'C20070627', 'data': u'76,000', 'rowLabel': u'Sales of Sales of Cherries'}

我需要腌制这个的原因是因为在合并结果并将它们放入数据库之前,我需要找出列标记的所有方法。第一个和第二个项目将是结果中的一行,第三个和第四个项目将是结果中的下一行(在有人决定统一列标题标签应该是什么之后)

我测试了泡菜并且能够保存和检索我的数据。但是,我需要能够保留输出中的顺序。我有一个想法是添加另一个可以作为计数器的密钥,这样我就可以检索我的数据,然后按计数器排序。还有更好的方法吗?

我不想把它放到数据库中,因为它不是永久性的。

我在下面标出了答案。这不是我得到的,所以我需要弄清楚问题是否在我的代码中的其他地方。

3 个答案:

答案 0 :(得分:5)

那泡菜怎么了?如果您将数据结构化为一个dicts列表,那么一切都应该按照您的意愿运行(如果我理解您的问题)。

>>> import pickle
>>> d1 = {1:'one', 2:'two', 3:'three'}
>>> d2 = {1:'eleven', 2:'twelve', 3:'thirteen'}
>>> d3 = {1:'twenty-one', 2:'twenty-two', 3:'twenty-three'}
>>> data = [d1, d2, d3]
>>> out = open('data.pickle', 'wb')
>>> pickle.dump(data, out)
>>> out.close()
>>> input = open('data.pickle')    
>>> data2 = pickle.load(input)
>>> data == data2
True

答案 1 :(得分:1)

Python不会在词典中保留顺序 但是,集合模块中有OrderedDict个类。

另一种选择是使用元组列表:

[('reportDate', u'R20080501'), ('idnum', u'1078099'), ...etc]

如果您需要稍后将其转换为字典,则可以使用内置的dict()

答案 2 :(得分:1)

Python dict是一个无序容器。如果您需要保留条目的顺序,则应考虑使用2元组列表。

另一个选择是保留一个额外的,有序的密钥列表。这样,您可以从字典提供的快速键控访问中受益,同时仍然能够以有序的方式迭代其值:

data = {'reportDate': u'R20070501', 'idnum': u'1078099', 
        'columnLabel': u'2005', 'actionDate': u'C20070627', 
        'data': u'76,000', 'rowLabel': u'Sales of Bananas'}
dataOrder = ['reportDate', 'idnum', 'columnLabel', 
             'actionDate', 'data', 'rowLabel']

for key in dataOrder:
    print key, data[key]