在Python中序列化用户定义的类

时间:2010-11-03 16:01:44

标签: python json serialization

有一个关于序列化我定义的类的问题。我有一些像

这样的课程
class Foo:
     def __init__(self, x, y):
          self.x = x, self.y = y

     def toDict(self):
          return dict(Foo = dict(x = self.x, y = self.y))

然后是一个可以包含多个Foos的类,例如:

class Bar:
     def __init__(self):
          self.foos = [Foo(a, b), Foo(1, 2)]

虽然这是对真实结构的粗略过度简化(它得到了更多,更多嵌套),但这是一个相当不错的概述。这个实际数据来自一个没有任何实际结构的伪XML文件,所以我根据给出的规范编写了一个解析器,所以我现在将所有数据都放在我定义的一系列类中,实际结构

我想要做的是获取我拥有的数据并将其吐出到JSON中,但我真的没有看到一个好方法(我是Python的新手,这是我的第一个真正的项目)

我在Foo中定义了一个方法toDict(),它从信息中创建了一个字典,但是当我尝试使用多个Foos序列化Bar时,这显然不会像我希望的那样。

有没有人有这样做的好方法?在过去的几天里,这是一个非常不间断的学习/代码节目,我对此缺乏想法,这是该项目的最后一部分。我知道Python的JSON模块,但是这对我将数据放入字典(或类似的东西)这个我可以传递给json.dump()的特殊问题没有帮助。

如果我能以任何方式澄清,请告诉我。

谢谢, T.J。

3 个答案:

答案 0 :(得分:5)

几条评论。第一:

  • xml.dom.minidom是一个内置的Python DOM实现。显然,如果文件实际上不是XML,你将无法使用它的内置解析函数,但看起来你正在构建一个类似于树的结构,在这种情况下你也可以使用minidom

好的,从此以后我会假设您有充分的理由编写自己的树型结构而不是使用内置结构。

  • 您确定节点应该是类吗?当你真正需要的是一堆嵌套的dict时,这似乎是一个非常多的结构:

    root = {
        "foo1": { "bar1": "spam", "bar2": "ham"},
        "foo2": { "baz1": "spam", "baz2": "ham"},
    }
    

    你明白了。

好的,也许您确定需要将各个节点作为类。在这种情况下,它们都应该从某些BaseNode类继承,对吧?毕竟,它们基本上是相似的东西。

  • 在这种情况下,定义一个BaseNode.serialise方法,该方法可以有效地打印一些有关自身的信息,然后在其所有子项上调用serialise。这是一个递归问题;你也可以使用递归解决方案,除非你的树真的真的嵌套。

    json库允许您继承JSONEncoder来执行此操作。

    >>> import json
    >>> class ComplexEncoder(json.JSONEncoder):
    ...     def default(self, obj):
    ...         if isinstance(obj, complex):
    ...             return [obj.real, obj.imag]
    ...         return json.JSONEncoder.default(self, obj)
    ...
    >>> dumps(2 + 1j, cls=ComplexEncoder)
    '[2.0, 1.0]'
    >>> ComplexEncoder().encode(2 + 1j)
    '[2.0, 1.0]'
    >>> list(ComplexEncoder().iterencode(2 + 1j))
    ['[', '2.0', ', ', '1.0', ']']
    

答案 1 :(得分:0)

无法使用JSON建议任何内容,但您可以使用Pickle模块以二进制格式序列化对象。

答案 2 :(得分:0)

您可以考虑使用jsonpickle包---它基本上允许您将大多数可选对象转换为json。