当使用Python类作为程序配置结构(包括继承的类属性)时,保存/恢复的好方法是什么?

时间:2018-05-30 21:34:39

标签: python configuration pickle

我们说我有一个(简化的)课程,如下所示。我正在使用它进行程序配置(超参数)。

# config.py
class Config(object):      # default configuration
    GPU_COUNT = 1
    IMAGES_PER_GPU = 2
    MAP = {1:2, 2:3}

    def display(self):
        pass

# experiment1.py
from config import Config as Default
class Config(Default):     # some over-written configuration
    GPU_COUNT = 2
    NAME='2'            

# run.py
from experiment1 import Config
cfg = Config()
...
cfg.NAME = 'ABC'            # possible runtime over-writing

# Now I would like to save `cfg` at this moment

我想保存此配置并稍后恢复。恢复时必须关注成员函数。

1。当我尝试泡菜时:

import pickle
with open('cfg.pk', 'rb') as f: cfg = pickle.load(f)

##--> AttributeError: Can't get attribute 'Config' on <module '__main__'>

我看到使用class_def Config的解决方案,但我希望我能在不知道类定义的情况下恢复配置(例如,导出到dict并保存为JSON)

2。我试图将类转换为dict (以便我可以导出为JSON)

cfg.__dict__     # {'NAME': 'ABC'}
vars(cfg)        # {'NAME': 'ABC'} 

在这两种情况下,都很难访问属性。有可能吗?

2 个答案:

答案 0 :(得分:3)

问题的标题是&#34;如何将python类转换为dict&#34;,但我怀疑你真的只是在寻找一种简单的方法来表示(超)参数。

到目前为止,最简单的解决方案是不使用类。我已经看到它发生在一些机器学习教程上,但我认为这是一个非常丑陋的黑客。它破坏了关于类与对象的一些语义,并且酸洗的难度是由此产生的。你怎么用这样一个简单的类:

class Params(dict):
    __getattr__ = dict.__getitem__
    __setattr__ = dict.__setitem__
    __delattr__ = dict.__delitem__

    def __getstate__(self):
        return self

    def __setstate__(self, state):
        self.update(state)

    def copy(self, **extra_params):
        return Params(**self, **extra_params)

它可以完成课程方法所能做的一切。然后,预定义的配置只是您在编辑之前应该复制的对象,如下所示:

config = Params(
    GPU_COUNT = 2,
    NAME='2',
)
other_config = config.copy()
other_config.GPU_COUNT = 4

或者只需一步:

other_config = config.copy(
    GPU_COUNT = 4
)

适用于pickle(虽然你 需要在你的源代码中的某个地方拥有Params类),你也可以轻松编写load和{{1}如果要使用JSON,请使用save类的方法。

简而言之,不要将类用于真正只是对象的东西。

答案 1 :(得分:0)

谢天谢地,@ evertheylen的回答对我很好。但是,代码在p.__class__ = Params时返回错误,所以我稍微改变如下。我认为它的工作原理相同。

class Params(dict):
    __getattr__ = dict.__getitem__
    __setattr__ = dict.__setitem__
    __delattr__ = dict.__delitem__

    def __getstate__(self):
        return self

    def __setstate__(self, state):
        self.update(state)

    def copy(self, **extra_params):
        lhs = Params()
        lhs.update(self)
        lhs.update(extra_params)
        return lhs

你可以做到

config = Params(
    GPU_COUNT = 2,
    NAME='2',
)
other_config = config.copy()
other_config.GPU_COUNT = 4