我正在尝试使用dask(async)框架执行一个简单的任务(一个实例方法),但它因序列化错误而失败。
有人能指出我正确的方向。
以下是我正在运行的代码:
from dask.distributed import Client, as_completed
import time
class DaskConnect:
def __init__(self):
print("Initialized:",self.__class__.__name__)
self.scheduler_host="192.168.0.4"
self.scheduler_port="8786"
def connect(self):
self.client = Client(self.scheduler_host+":"+self.scheduler_port)
# self.client = Client()
return self.client
def disconnect(self):
self.client.close()
class TestDask:
def __init__(self):
print("Initialized:",self.__class__.__name__)
self.dask_client=DaskConnect().connect()
def do_task(self,msg):
time.sleep(30)
return msg
def run(self):
tasks=[1]
# tasks = [1, 2, 3, 4, 5]
futures=[]
for task in tasks:
print("Submitting:",task)
future = self.dask_client.submit(self.do_task, "Task:"+str(task))
futures.append(future)
for future in as_completed(futures):
result = future.result()
print("Result",result)
TestDask().run()
错误:
distributed.protocol.pickle - INFO - 无法在0x101c408d0>>序列化main.TestDask对象。 例外:无法挑选select.kqueue对象Traceback(最近的 最后打电话):
答案 0 :(得分:3)
Dask客户端目前无法序列化。包含Dask客户端的任何对象也不可序列化。通常,序列化包含活动网络连接,锁等的任何内容都是一项挑战。
也许还有另一种解决方法吗?