我使用以下测试代码:
from pathos.multiprocessing import ProcessingPool as Pool
import numpy
def foo(obj1, obj2):
a = obj1**2
b = numpy.asarray(range(1,5))
return obj1, b
if __name__ == '__main__':
p = Pool(5)
res = p.map(foo, [1,2,3], [4,5,6])
它给出错误:
File "C:\Python27\lib\site-packages\multiprocess\pool.py", line 567, in get
raise self._value
NameError: global name 'numpy' is not defined
我在代码中做错了什么?
编辑:为什么这个问题被投了两次?
我安装了numpy并且我的解释器一直在正确使用它,直到我尝试将其用于多处理。我已经用相同的安装编写了一段时间。
答案 0 :(得分:2)
似乎进程之间不共享导入。因此,您需要在所有流程中单独import numpy
。
在您的情况下,这意味着在import numpy
功能中添加foo
。流程不是轻量级的,因此import
不会减慢你的速度(至少不会显着)。
另一种选择是将模块传递给函数(不推荐,我不确定这是否有效):
if __name__ == '__main__':
p = Pool(5)
res = p.map(foo, numpy, [1,2,3], [4,5,6])
def foo(np, obj1, obj2):
a = obj1**2
b = np.asarray(range(1,5))
return obj1, b