分析多进程Python脚本时出现神秘的pickle错误

时间:2012-07-16 21:00:51

标签: python parallel-processing profiling

我正在使用multiprocessing模块,我正在使用UpdateMessage个对象(我自己的类),通过multiprocessing.Queue个对象发送,以便在进程之间进行通信。这是类:

class UpdateMessage:
    def __init__(self, arrayref, rowslice, colslice, newval):
        self.arrayref = arrayref
        self.rowslice = rowslice
        self.colslice = colslice
        self.newval = newval
    def do_update(self):
        if self.arrayref == 'uL':
            arr = uL
        elif self.arrayref == 'uR':
            arr = uR
        else:
            raise Exception('UpdateMessage.arrayref neither uL nor uR')
        arr[self.rowslice, self.colslice] = self.newval

当我运行脚本时,它完全正常。但是,当我使用cProfileprofile运行它时,会出现以下错误:

_pickle.PicklingError: Can't pickle <class '__main__.UpdateMessage'>: attribute lookup __main__.UpdateMessage failed

这似乎是试图挑选课程,但我不明白为什么会发生这种情况。我的代码没有这样做,没有它就可以正常工作,所以它可能是multiprocessing模块。但为什么需要挑选UpdateMessage,我该如何修复错误?

编辑:这是发送UpdateMessage的代码的一部分(脚本的多个部分执行此操作,但都以相同的方式):

msg = UpdateMessage(uLref, refer[0] + marker[0] - 2,
                    slice(uL.shape[1]), ustar.copy())
queue.put(msg)

回溯不是很有帮助:

Traceback (most recent call last):
  File "/usr/lib/python3.2/multiprocessing/queues.py", line 272, in _feed
    send(obj)

3 个答案:

答案 0 :(得分:4)

我遇到了同样的问题,并通过在自己的文件中定义要腌制的类来解决它。

答案 1 :(得分:3)

我不知道你的流程是怎样的,但是:

'__main__.UpdateMessage'

指的是已启动模块中的UpdateMessage。

如果没有使用类UpdateMessage的模块启动另一个进程,则UpdateMessage将不可用。

您必须导入包含UpdateMessage的模块 UpdateMessage.__module__ is not '__main__'

然后Pickle也可以在其他程序中找到UpdateMessage。

我建议__main__.py看起来像这样:

import UpdateMessage_module

UpdateMessage_module.main()

答案 2 :(得分:0)

我假设在你的课程被发送到另一个程序之前,你的班级正在进行酸洗尝试。最简单的解决方案可能只是在你的类上明确地实现pickle-protocol ...